Install a more robust solution for the problem of infinite error-processing
authorTom Lane <[email protected]>
Mon, 27 Oct 2008 19:37:42 +0000 (19:37 +0000)
committerTom Lane <[email protected]>
Mon, 27 Oct 2008 19:37:42 +0000 (19:37 +0000)
recursion when we are unable to convert a localized error message to the
client's encoding.  We've been over this ground before, but as reported by
Ibrar Ahmed, it still didn't work in the case of conversion failures for
the conversion-failure message itself :-(.  Fix by installing a "circuit
breaker" that disables attempts to localize this message once we get into
recursion trouble.

Patch all supported branches, because it is in fact broken in all of them;
though I had to add some missing translations to the older branches in
order to expose the failure in the particular test case I was using.

doc/src/sgml/sources.sgml
src/backend/nls.mk
src/backend/utils/error/elog.c
src/backend/utils/mb/wchar.c
src/include/utils/elog.h

index f20ee37878ecf96af2500b8ce5ef4d2c93117297..81f7bb3a8c89661d0ccfcd578bd5ce7b04de7cd6 100644 (file)
@@ -179,7 +179,7 @@ ereport(ERROR,
     <para>
      <function>errmsg_internal(const char *msg, ...)</function> is the same as
      <function>errmsg</>, except that the message string will not be
-     included in the internationalization message dictionary.
+     translated nor included in the internationalization message dictionary.
      This should be used for <quote>can't happen</> cases that are probably
      not worth expending translation effort on.
     </para>
@@ -255,7 +255,7 @@ elog(level, "format string", ...);
 ereport(level, (errmsg_internal("format string", ...)));
 </programlisting>
     Notice that the SQLSTATE errcode is always defaulted, and the message
-    string is not included in the internationalization message dictionary.
+    string is not subject to translation.
     Therefore, <function>elog</> should be used only for internal errors and
     low-level debug logging.  Any message that is likely to be of interest to
     ordinary users should go through <function>ereport</>.  Nonetheless,
index bb011d1fa46fb510506eac55abd856f9eda12929..30af969aadf75f18f52484f488bace04cb293b86 100644 (file)
@@ -2,8 +2,6 @@
 CATALOG_NAME   := postgres
 AVAIL_LANGUAGES        := af cs de es fr hr hu it ko nb pt_BR ro ru sk sl sv tr zh_CN zh_TW
 GETTEXT_FILES  := + gettext-files
-# you can add "elog:2" and "errmsg_internal" to this list if you want to
-# include internal messages in the translation list.
 GETTEXT_TRIGGERS:= _ errmsg errdetail errhint errcontext write_stderr yyerror
 
 gettext-files: distprep
index f973f5a529effd133eb9a5b1c4acac2666607ec0..953186d1834358c37ab01ff893e0c467f19c0102 100644 (file)
@@ -124,6 +124,21 @@ static const char *error_severity(int elevel);
 static void append_with_tabs(StringInfo buf, const char *str);
 static void write_pipe_chunks(int fd, char *data, int len);
 
+
+/*
+ * in_error_recursion_trouble --- are we at risk of infinite error recursion?
+ *
+ * This function exists to provide common control of various fallback steps
+ * that we take if we think we are facing infinite error recursion.  See the
+ * callers for details.
+ */
+bool
+in_error_recursion_trouble(void)
+{
+       /* Pull the plug if recurse more than once */
+       return (recursion_depth > 2);
+}
+
 /*
  * errstart --- begin an error-reporting cycle
  *
@@ -259,12 +274,12 @@ errstart(int elevel, const char *filename, int lineno,
                MemoryContextReset(ErrorContext);
 
                /*
-                * If we recurse more than once, the problem might be something broken
+                * Infinite error recursion might be due to something broken
                 * in a context traceback routine.  Abandon them too.  We also
                 * abandon attempting to print the error statement (which, if long,
                 * could itself be the source of the recursive failure).
                 */
-               if (recursion_depth > 2)
+               if (in_error_recursion_trouble())
                {
                        error_context_stack = NULL;
                        debug_query_string = NULL;
@@ -593,18 +608,20 @@ errcode_for_socket_access(void)
  * it's common code for errmsg(), errdetail(), etc.  Must be called inside
  * a routine that is declared like "const char *fmt, ..." and has an edata
  * pointer set up.     The message is assigned to edata->targetfield, or
- * appended to it if appendval is true.
+ * appended to it if appendval is true.  The message is subject to translation
+ * if translateit is true.
  *
  * Note: we pstrdup the buffer rather than just transferring its storage
  * to the edata field because the buffer might be considerably larger than
  * really necessary.
  */
-#define EVALUATE_MESSAGE(targetfield, appendval)  \
+#define EVALUATE_MESSAGE(targetfield, appendval, translateit)  \
        { \
                char               *fmtbuf; \
                StringInfoData  buf; \
                /* Internationalize the error format string */ \
-               fmt = _(fmt); \
+               if (translateit) \
+                       fmt = _(fmt); \
                /* Expand %m in format string */ \
                fmtbuf = expand_fmt_string(fmt, edata); \
                initStringInfo(&buf); \
@@ -651,7 +668,7 @@ errmsg(const char *fmt,...)
        CHECK_STACK_DEPTH();
        oldcontext = MemoryContextSwitchTo(ErrorContext);
 
-       EVALUATE_MESSAGE(message, false);
+       EVALUATE_MESSAGE(message, false, true);
 
        MemoryContextSwitchTo(oldcontext);
        recursion_depth--;
@@ -663,9 +680,12 @@ errmsg(const char *fmt,...)
  * errmsg_internal --- add a primary error message text to the current error
  *
  * This is exactly like errmsg() except that strings passed to errmsg_internal
- * are customarily left out of the internationalization message dictionary.
- * This should be used for "can't happen" cases that are probably not worth
- * spending translation effort on.
+ * are not translated, and are customarily left out of the
+ * internationalization message dictionary.  This should be used for "can't
+ * happen" cases that are probably not worth spending translation effort on.
+ * We also use this for certain cases where we *must* not try to translate
+ * the message because the translation would fail and result in infinite
+ * error recursion.
  */
 int
 errmsg_internal(const char *fmt,...)
@@ -677,7 +697,7 @@ errmsg_internal(const char *fmt,...)
        CHECK_STACK_DEPTH();
        oldcontext = MemoryContextSwitchTo(ErrorContext);
 
-       EVALUATE_MESSAGE(message, false);
+       EVALUATE_MESSAGE(message, false, false);
 
        MemoryContextSwitchTo(oldcontext);
        recursion_depth--;
@@ -698,7 +718,7 @@ errdetail(const char *fmt,...)
        CHECK_STACK_DEPTH();
        oldcontext = MemoryContextSwitchTo(ErrorContext);
 
-       EVALUATE_MESSAGE(detail, false);
+       EVALUATE_MESSAGE(detail, false, true);
 
        MemoryContextSwitchTo(oldcontext);
        recursion_depth--;
@@ -719,7 +739,7 @@ errhint(const char *fmt,...)
        CHECK_STACK_DEPTH();
        oldcontext = MemoryContextSwitchTo(ErrorContext);
 
-       EVALUATE_MESSAGE(hint, false);
+       EVALUATE_MESSAGE(hint, false, true);
 
        MemoryContextSwitchTo(oldcontext);
        recursion_depth--;
@@ -744,7 +764,7 @@ errcontext(const char *fmt,...)
        CHECK_STACK_DEPTH();
        oldcontext = MemoryContextSwitchTo(ErrorContext);
 
-       EVALUATE_MESSAGE(context, true);
+       EVALUATE_MESSAGE(context, true, true);
 
        MemoryContextSwitchTo(oldcontext);
        recursion_depth--;
@@ -922,12 +942,12 @@ elog_finish(int elevel, const char *fmt,...)
                return;                                 /* nothing to do */
 
        /*
-        * Format error message just like errmsg().
+        * Format error message just like errmsg_internal().
         */
        recursion_depth++;
        oldcontext = MemoryContextSwitchTo(ErrorContext);
 
-       EVALUATE_MESSAGE(message, false);
+       EVALUATE_MESSAGE(message, false, false);
 
        MemoryContextSwitchTo(oldcontext);
        recursion_depth--;
@@ -1076,7 +1096,9 @@ ReThrowError(ErrorData *edata)
                /*
                 * Wups, stack not big enough.  We treat this as a PANIC condition
                 * because it suggests an infinite loop of errors during error
-                * recovery.
+                * recovery.  Note that the message is intentionally not localized,
+                * else failure to convert it to client encoding could cause further
+                * recursion.
                 */
                errordata_stack_depth = -1;             /* make room on stack */
                ereport(PANIC, (errmsg_internal("ERRORDATA_STACK_SIZE exceeded")));
@@ -2010,6 +2032,10 @@ useful_strerror(int errnum)
 
 /*
  * error_severity --- get localized string representing elevel
+ *
+ * Note: in an error recursion situation, we stop localizing the tags
+ * for ERROR and above.  This is necessary because the problem might be
+ * failure to convert one of these strings to the client encoding.
  */
 static const char *
 error_severity(int elevel)
@@ -2039,13 +2065,22 @@ error_severity(int elevel)
                        prefix = _("WARNING");
                        break;
                case ERROR:
-                       prefix = _("ERROR");
+                       if (in_error_recursion_trouble())
+                               prefix = "ERROR";
+                       else
+                               prefix = _("ERROR");
                        break;
                case FATAL:
-                       prefix = _("FATAL");
+                       if (in_error_recursion_trouble())
+                               prefix = "FATAL";
+                       else
+                               prefix = _("FATAL");
                        break;
                case PANIC:
-                       prefix = _("PANIC");
+                       if (in_error_recursion_trouble())
+                               prefix = "PANIC";
+                       else
+                               prefix = _("PANIC");
                        break;
                default:
                        prefix = "???";
index b4cea5c33d2eb0331ac34bede8fbc8f99cf68a9e..a187f76526e75f554b66e41a53974a1b3042ff16 100644 (file)
@@ -1379,7 +1379,20 @@ report_untranslatable_char(int src_encoding, int dest_encoding,
        for (j = 0; j < jlimit; j++)
                p += sprintf(p, "%02x", (unsigned char) mbstr[j]);
 
-       ereport(ERROR,
+       /*
+        * In an error recursion situation, don't try to translate the message.
+        * This gets us out of trouble if the problem is failure to convert
+        * this very message (after translation) to the client encoding.
+        */
+       if (in_error_recursion_trouble())
+               ereport(ERROR,
+                       (errcode(ERRCODE_UNTRANSLATABLE_CHARACTER),
+                        errmsg_internal("character 0x%s of encoding \"%s\" has no equivalent in \"%s\"",
+                                       buf,
+                                       pg_enc2name_tbl[src_encoding].name,
+                                       pg_enc2name_tbl[dest_encoding].name)));
+       else
+               ereport(ERROR,
                        (errcode(ERRCODE_UNTRANSLATABLE_CHARACTER),
                         errmsg("character 0x%s of encoding \"%s\" has no equivalent in \"%s\"",
                                        buf,
index c32c3747af5b1e0e596abdffbe394ffab99e75fe..70ecdfe34e309f347644571479e4352277298c90 100644 (file)
@@ -282,6 +282,7 @@ extern int  Log_destination;
 /* Other exported functions */
 extern void DebugFileOpen(void);
 extern char *unpack_sql_state(int sql_state);
+extern bool in_error_recursion_trouble(void);
 
 #ifdef HAVE_SYSLOG
 extern void set_syslog_parameters(const char *ident, int facility);