Convert newlines to spaces in names written in v11+ pg_dump comments.
authorNoah Misch <[email protected]>
Mon, 11 Aug 2025 13:18:59 +0000 (06:18 -0700)
committerNoah Misch <[email protected]>
Mon, 11 Aug 2025 13:19:03 +0000 (06:19 -0700)
Maliciously-crafted object names could achieve SQL injection during
restore.  CVE-2012-0868 fixed this class of problem at the time, but
later work reintroduced three cases.  Commit
bc8cd50fefd369b217f80078585c486505aafb62 (back-patched to v11+ in
2023-05 releases) introduced the pg_dump case.  Commit
6cbdbd9e8d8f2986fde44f2431ed8d0c8fce7f5d (v12+) introduced the two
pg_dumpall cases.  Move sanitize_line(), unchanged, to dumputils.c so
pg_dumpall has access to it in all supported versions.  Back-patch to
v13 (all supported versions).

Reviewed-by: Robert Haas <[email protected]>
Reviewed-by: Nathan Bossart <[email protected]>
Backpatch-through: 13
Security: CVE-2025-8715

src/bin/pg_dump/dumputils.c
src/bin/pg_dump/dumputils.h
src/bin/pg_dump/pg_backup_archiver.c
src/bin/pg_dump/pg_dump.c
src/bin/pg_dump/pg_dumpall.c
src/bin/pg_dump/t/002_pg_dump.pl
src/bin/pg_dump/t/003_pg_dump_with_server.pl

index d2851cf568ea84e75d96c68aee5c7600741aa232..43891955761897a2c46e82ee3a0db5de2da50e88 100644 (file)
@@ -29,6 +29,43 @@ static void AddAcl(PQExpBuffer aclbuf, const char *keyword,
                   const char *subname);
 
 
+/*
+ * Sanitize a string to be included in an SQL comment or TOC listing, by
+ * replacing any newlines with spaces.  This ensures each logical output line
+ * is in fact one physical output line, to prevent corruption of the dump
+ * (which could, in the worst case, present an SQL injection vulnerability
+ * if someone were to incautiously load a dump containing objects with
+ * maliciously crafted names).
+ *
+ * The result is a freshly malloc'd string.  If the input string is NULL,
+ * return a malloc'ed empty string, unless want_hyphen, in which case return a
+ * malloc'ed hyphen.
+ *
+ * Note that we currently don't bother to quote names, meaning that the name
+ * fields aren't automatically parseable.  "pg_restore -L" doesn't care because
+ * it only examines the dumpId field, but someday we might want to try harder.
+ */
+char *
+sanitize_line(const char *str, bool want_hyphen)
+{
+   char       *result;
+   char       *s;
+
+   if (!str)
+       return pg_strdup(want_hyphen ? "-" : "");
+
+   result = pg_strdup(str);
+
+   for (s = result; *s != '\0'; s++)
+   {
+       if (*s == '\n' || *s == '\r')
+           *s = ' ';
+   }
+
+   return result;
+}
+
+
 /*
  * Build GRANT/REVOKE command(s) for an object.
  *
index 2c81f51837b13135b7e7d34ba813c63989ac8acf..a6b8b478638c3c83af3dab781fd85ae0b97dfc8e 100644 (file)
@@ -36,6 +36,7 @@
 #endif
 
 
+extern char *sanitize_line(const char *str, bool want_hyphen);
 extern bool buildACLCommands(const char *name, const char *subname, const char *nspname,
                             const char *type, const char *acls, const char *baseacls,
                             const char *owner, const char *prefix, int remoteVersion,
index 3448aba12f47b04f806e351d9076ea720730ab7f..b1ea5db46eeb0d457d4144c6b4b585021b728288 100644 (file)
@@ -69,7 +69,6 @@ static ArchiveHandle *_allocAH(const char *FileSpec, const ArchiveFormat fmt,
                               SetupWorkerPtrType setupWorkerPtr);
 static void _getObjectDescription(PQExpBuffer buf, const TocEntry *te);
 static void _printTocEntry(ArchiveHandle *AH, TocEntry *te, bool isData);
-static char *sanitize_line(const char *str, bool want_hyphen);
 static void _doSetFixedOutputState(ArchiveHandle *AH);
 static void _doSetSessionAuth(ArchiveHandle *AH, const char *user);
 static void _reconnectToDB(ArchiveHandle *AH, const char *dbname);
@@ -3684,42 +3683,6 @@ _printTocEntry(ArchiveHandle *AH, TocEntry *te, bool isData)
    }
 }
 
-/*
- * Sanitize a string to be included in an SQL comment or TOC listing, by
- * replacing any newlines with spaces.  This ensures each logical output line
- * is in fact one physical output line, to prevent corruption of the dump
- * (which could, in the worst case, present an SQL injection vulnerability
- * if someone were to incautiously load a dump containing objects with
- * maliciously crafted names).
- *
- * The result is a freshly malloc'd string.  If the input string is NULL,
- * return a malloc'ed empty string, unless want_hyphen, in which case return a
- * malloc'ed hyphen.
- *
- * Note that we currently don't bother to quote names, meaning that the name
- * fields aren't automatically parseable.  "pg_restore -L" doesn't care because
- * it only examines the dumpId field, but someday we might want to try harder.
- */
-static char *
-sanitize_line(const char *str, bool want_hyphen)
-{
-   char       *result;
-   char       *s;
-
-   if (!str)
-       return pg_strdup(want_hyphen ? "-" : "");
-
-   result = pg_strdup(str);
-
-   for (s = result; *s != '\0'; s++)
-   {
-       if (*s == '\n' || *s == '\r')
-           *s = ' ';
-   }
-
-   return result;
-}
-
 /*
  * Write the file header for a custom-format archive
  */
index 21fac81fa097692d3211352af3e39df185a354bd..427e4ae13221190e4a53c10056353dd38fe354b0 100644 (file)
@@ -2609,11 +2609,14 @@ dumpTableData(Archive *fout, const TableDataInfo *tdinfo)
         forcePartitionRootLoad(tbinfo)))
    {
        TableInfo  *parentTbinfo;
+       char       *sanitized;
 
        parentTbinfo = getRootTableInfo(tbinfo);
        copyFrom = fmtQualifiedDumpable(parentTbinfo);
+       sanitized = sanitize_line(copyFrom, true);
        printfPQExpBuffer(copyBuf, "-- load via partition root %s",
-                         copyFrom);
+                         sanitized);
+       free(sanitized);
        tdDefn = pg_strdup(copyBuf->data);
    }
    else
index 36408b3676c87767360b24a4a95066dd4d4e20f9..41dc2cbaaca9d2a177eb04a88bb0d5a6adf81781 100644 (file)
@@ -1447,7 +1447,13 @@ dumpUserConfig(PGconn *conn, const char *username)
    res = executeQuery(conn, buf->data);
 
    if (PQntuples(res) > 0)
-       fprintf(OPF, "\n--\n-- User Config \"%s\"\n--\n\n", username);
+   {
+       char       *sanitized;
+
+       sanitized = sanitize_line(username, true);
+       fprintf(OPF, "\n--\n-- User Config \"%s\"\n--\n\n", sanitized);
+       free(sanitized);
+   }
 
    for (int i = 0; i < PQntuples(res); i++)
    {
@@ -1549,6 +1555,7 @@ dumpDatabases(PGconn *conn)
    for (i = 0; i < PQntuples(res); i++)
    {
        char       *dbname = PQgetvalue(res, i, 0);
+       char       *sanitized;
        const char *create_opts;
        int         ret;
 
@@ -1565,7 +1572,9 @@ dumpDatabases(PGconn *conn)
 
        pg_log_info("dumping database \"%s\"", dbname);
 
-       fprintf(OPF, "--\n-- Database \"%s\" dump\n--\n\n", dbname);
+       sanitized = sanitize_line(dbname, true);
+       fprintf(OPF, "--\n-- Database \"%s\" dump\n--\n\n", sanitized);
+       free(sanitized);
 
        /*
         * We assume that "template1" and "postgres" already exist in the
index b633b95f0d79ae3f742673a0314d8b24be077a03..b052510537da2324386e27487e7855f848065879 100644 (file)
@@ -1907,6 +1907,27 @@ my %tests = (
        },
    },
 
+   'newline of role or table name in comment' => {
+       create_sql => qq{CREATE ROLE regress_newline;
+                        ALTER ROLE regress_newline SET enable_seqscan = off;
+                        ALTER ROLE regress_newline
+                           RENAME TO "regress_newline\nattack";
+
+                        -- meet getPartitioningInfo() "unsafe" condition
+                        CREATE TYPE pp_colors AS
+                           ENUM ('green', 'blue', 'black');
+                        CREATE TABLE pp_enumpart (a pp_colors)
+                           PARTITION BY HASH (a);
+                        CREATE TABLE pp_enumpart1 PARTITION OF pp_enumpart
+                           FOR VALUES WITH (MODULUS 2, REMAINDER 0);
+                        CREATE TABLE pp_enumpart2 PARTITION OF pp_enumpart
+                           FOR VALUES WITH (MODULUS 2, REMAINDER 1);
+                        ALTER TABLE pp_enumpart
+                           RENAME TO "pp_enumpart\nattack";},
+       regexp => qr/\n--[^\n]*\nattack/s,
+       like => {},
+   },
+
    'CREATE DATABASE regression_invalid...' => {
        create_order => 1,
        create_sql => q(
index ab025c44a4325ff9084c74a85e6bd2fc255d075a..6c6bee4fe0c3a28007e5e33e4a2797607b1bdbbd 100644 (file)
@@ -16,6 +16,22 @@ my $port = $node->port;
 $node->init;
 $node->start;
 
+#########################################
+# pg_dumpall: newline in database name
+
+$node->safe_psql('postgres', qq{CREATE DATABASE "regress_\nattack"});
+
+my (@cmd, $stdout, $stderr);
+@cmd = ("pg_dumpall", '--port' => $port, '--exclude-database=postgres');
+print("# Running: " . join(" ", @cmd) . "\n");
+my $result = IPC::Run::run \@cmd, '>' => \$stdout, '2>' => \$stderr;
+ok(!$result, "newline in dbname: exit code not 0");
+like(
+   $stderr,
+   qr/shell command argument contains a newline/,
+   "newline in dbname: stderr matches");
+unlike($stdout, qr/^attack/m, "newline in dbname: no comment escape");
+
 #########################################
 # Verify that dumping foreign data includes only foreign tables of
 # matching servers
@@ -26,7 +42,6 @@ $node->safe_psql('postgres', "CREATE SERVER s1 FOREIGN DATA WRAPPER dummy");
 $node->safe_psql('postgres', "CREATE SERVER s2 FOREIGN DATA WRAPPER dummy");
 $node->safe_psql('postgres', "CREATE FOREIGN TABLE t0 (a int) SERVER s0");
 $node->safe_psql('postgres', "CREATE FOREIGN TABLE t1 (a int) SERVER s1");
-my ($cmd, $stdout, $stderr, $result);
 
 command_fails_like(
    [ "pg_dump", '-p', $port, '--include-foreign-data=s0', 'postgres' ],