[HOTFIX] [SQL] Disables Metastore Parquet table conversion for "SQLQuerySuite.CTAS with serde"

Ideally we should convert Metastore Parquet tables with our own Parquet implementation on both read path and write path. However, the write path is not well covered, and causes this test failure. This PR is a hotfix to bring back Jenkins PR builder. A proper fix will be delivered in a follow-up PR.  [<img src="https://reviewable.io/review_button.png" height=40 alt="Review on Reviewable"/>](https://reviewable.io/reviews/apache/spark/4413)  Author: Cheng Lian <lian@databricks.com> Closes #4413 from liancheng/hotfix-parquet-ctas and squashes the following commits: 5291289 [Cheng Lian] Hot fix for "SQLQuerySuite.CTAS with serde"

[HOTFIX] [SQL] Disables Metastore Parquet table conversion for "SQLQuerySuite.CTAS with serde"
7c0a648f · Cheng Lian · e8a5d50a · 7c0a648f
Commit 7c0a648f authored 10 years ago by Cheng Lian
--- a/sql/hive/src/test/scala/org/apache/spark/sql/hive/execution/SQLQuerySuite.scala
+++ b/sql/hive/src/test/scala/org/apache/spark/sql/hive/execution/SQLQuerySuite.scala
@@ -17,13 +17,10 @@
 package org.apache.spark.sql.hive.execution
-import org.apache.spark.sql.QueryTest
+import org.apache.spark.sql.hive.HiveShim
-import org.apache.spark.sql.Row
 import org.apache.spark.sql.hive.test.TestHive._
 import org.apache.spark.sql.types._
-import org.apache.spark.util.Utils
+import org.apache.spark.sql.{QueryTest, Row, SQLConf}
-import org.apache.spark.sql.hive.HiveShim
 case class Nested1(f1: Nested2)
 case class Nested2(f2: Nested3)
@@ -109,28 +106,34 @@ class SQLQuerySuite extends QueryTest {
    )
    if (HiveShim.version =="0.13.1") {
-      sql(
+      val origUseParquetDataSource = conf.parquetUseDataSourceApi
-        """CREATE TABLE ctas5
+      try {
-          | STORED AS parquet AS
+        setConf(SQLConf.PARQUET_USE_DATA_SOURCE_API, "false")
-          |   SELECT key, value
+        sql(
-          |   FROM src
+          """CREATE TABLE ctas5
-          |   ORDER BY key, value""".stripMargin).collect
+            | STORED AS parquet AS
+            |   SELECT key, value
-      checkExistence(sql("DESC EXTENDED ctas5"), true,
+            |   FROM src
-        "name:key", "type:string", "name:value", "ctas5",
+            |   ORDER BY key, value""".stripMargin).collect()
-        "org.apache.hadoop.hive.ql.io.parquet.MapredParquetInputFormat",
-        "org.apache.hadoop.hive.ql.io.parquet.MapredParquetOutputFormat",
+        checkExistence(sql("DESC EXTENDED ctas5"), true,
-        "org.apache.hadoop.hive.ql.io.parquet.serde.ParquetHiveSerDe",
+          "name:key", "type:string", "name:value", "ctas5",
-        "MANAGED_TABLE"
+          "org.apache.hadoop.hive.ql.io.parquet.MapredParquetInputFormat",
-      )
+          "org.apache.hadoop.hive.ql.io.parquet.MapredParquetOutputFormat",
+          "org.apache.hadoop.hive.ql.io.parquet.serde.ParquetHiveSerDe",
-      val default = getConf("spark.sql.hive.convertMetastoreParquet", "true")
+          "MANAGED_TABLE"
-      // use the Hive SerDe for parquet tables
+        )
-      sql("set spark.sql.hive.convertMetastoreParquet = false")
-      checkAnswer(
+        val default = getConf("spark.sql.hive.convertMetastoreParquet", "true")
-        sql("SELECT key, value FROM ctas5 ORDER BY key, value"),
+        // use the Hive SerDe for parquet tables
-        sql("SELECT key, value FROM src ORDER BY key, value").collect().toSeq)
+        sql("set spark.sql.hive.convertMetastoreParquet = false")
-      sql(s"set spark.sql.hive.convertMetastoreParquet = $default")
+        checkAnswer(
+          sql("SELECT key, value FROM ctas5 ORDER BY key, value"),
+          sql("SELECT key, value FROM src ORDER BY key, value").collect().toSeq)
+        sql(s"set spark.sql.hive.convertMetastoreParquet = $default")
+      } finally {
+        setConf(SQLConf.PARQUET_USE_DATA_SOURCE_API, origUseParquetDataSource.toString)
+      }
    }
  }