Edit on GitHub

sqlglot.dialects.bigquery

View Source

  1from __future__ import annotations
  2
  3import logging
  4import re
  5import typing as t
  6
  7from sqlglot import exp, generator, parser, tokens, transforms
  8from sqlglot._typing import E
  9from sqlglot.dialects.dialect import (
 10    Dialect,
 11    datestrtodate_sql,
 12    format_time_lambda,
 13    inline_array_sql,
 14    max_or_greatest,
 15    min_or_least,
 16    no_ilike_sql,
 17    parse_date_delta_with_interval,
 18    rename_func,
 19    timestrtotime_sql,
 20    ts_or_ds_to_date_sql,
 21)
 22from sqlglot.helper import seq_get, split_num_words
 23from sqlglot.tokens import TokenType
 24
 25logger = logging.getLogger("sqlglot")
 26
 27
 28def _date_add_sql(
 29    data_type: str, kind: str
 30) -> t.Callable[[generator.Generator, exp.Expression], str]:
 31    def func(self, expression):
 32        this = self.sql(expression, "this")
 33        unit = expression.args.get("unit")
 34        unit = exp.var(unit.name.upper() if unit else "DAY")
 35        interval = exp.Interval(this=expression.expression, unit=unit)
 36        return f"{data_type}_{kind}({this}, {self.sql(interval)})"
 37
 38    return func
 39
 40
 41def _derived_table_values_to_unnest(self: generator.Generator, expression: exp.Values) -> str:
 42    if not isinstance(expression.unnest().parent, exp.From):
 43        return self.values_sql(expression)
 44
 45    alias = expression.args.get("alias")
 46
 47    structs = [
 48        exp.Struct(
 49            expressions=[
 50                exp.alias_(value, column_name)
 51                for value, column_name in zip(
 52                    t.expressions,
 53                    alias.columns
 54                    if alias and alias.columns
 55                    else (f"_c{i}" for i in range(len(t.expressions))),
 56                )
 57            ]
 58        )
 59        for t in expression.find_all(exp.Tuple)
 60    ]
 61
 62    return self.unnest_sql(exp.Unnest(expressions=[exp.Array(expressions=structs)]))
 63
 64
 65def _returnsproperty_sql(self: generator.Generator, expression: exp.ReturnsProperty) -> str:
 66    this = expression.this
 67    if isinstance(this, exp.Schema):
 68        this = f"{this.this} <{self.expressions(this)}>"
 69    else:
 70        this = self.sql(this)
 71    return f"RETURNS {this}"
 72
 73
 74def _create_sql(self: generator.Generator, expression: exp.Create) -> str:
 75    kind = expression.args["kind"]
 76    returns = expression.find(exp.ReturnsProperty)
 77    if kind.upper() == "FUNCTION" and returns and returns.args.get("is_table"):
 78        expression = expression.copy()
 79        expression.set("kind", "TABLE FUNCTION")
 80        if isinstance(
 81            expression.expression,
 82            (
 83                exp.Subquery,
 84                exp.Literal,
 85            ),
 86        ):
 87            expression.set("expression", expression.expression.this)
 88
 89        return self.create_sql(expression)
 90
 91    return self.create_sql(expression)
 92
 93
 94def _unqualify_unnest(expression: exp.Expression) -> exp.Expression:
 95    """Remove references to unnest table aliases since bigquery doesn't allow them.
 96
 97    These are added by the optimizer's qualify_column step.
 98    """
 99    from sqlglot.optimizer.scope import Scope
100
101    if isinstance(expression, exp.Select):
102        for unnest in expression.find_all(exp.Unnest):
103            if isinstance(unnest.parent, (exp.From, exp.Join)) and unnest.alias:
104                for column in Scope(expression).find_all(exp.Column):
105                    if column.table == unnest.alias:
106                        column.set("table", None)
107
108    return expression
109
110
111# https://issuetracker.google.com/issues/162294746
112# workaround for bigquery bug when grouping by an expression and then ordering
113# WITH x AS (SELECT 1 y)
114# SELECT y + 1 z
115# FROM x
116# GROUP BY x + 1
117# ORDER by z
118def _alias_ordered_group(expression: exp.Expression) -> exp.Expression:
119    if isinstance(expression, exp.Select):
120        group = expression.args.get("group")
121        order = expression.args.get("order")
122
123        if group and order:
124            aliases = {
125                select.this: select.args["alias"]
126                for select in expression.selects
127                if isinstance(select, exp.Alias)
128            }
129
130            for e in group.expressions:
131                alias = aliases.get(e)
132
133                if alias:
134                    e.replace(exp.column(alias))
135
136    return expression
137
138
139def _pushdown_cte_column_names(expression: exp.Expression) -> exp.Expression:
140    """BigQuery doesn't allow column names when defining a CTE, so we try to push them down."""
141    if isinstance(expression, exp.CTE) and expression.alias_column_names:
142        cte_query = expression.this
143
144        if cte_query.is_star:
145            logger.warning(
146                "Can't push down CTE column names for star queries. Run the query through"
147                " the optimizer or use 'qualify' to expand the star projections first."
148            )
149            return expression
150
151        column_names = expression.alias_column_names
152        expression.args["alias"].set("columns", None)
153
154        for name, select in zip(column_names, cte_query.selects):
155            to_replace = select
156
157            if isinstance(select, exp.Alias):
158                select = select.this
159
160            # Inner aliases are shadowed by the CTE column names
161            to_replace.replace(exp.alias_(select, name))
162
163    return expression
164
165
166def _parse_timestamp(args: t.List) -> exp.StrToTime:
167    this = format_time_lambda(exp.StrToTime, "bigquery")([seq_get(args, 1), seq_get(args, 0)])
168    this.set("zone", seq_get(args, 2))
169    return this
170
171
172def _parse_date(args: t.List) -> exp.Date | exp.DateFromParts:
173    expr_type = exp.DateFromParts if len(args) == 3 else exp.Date
174    return expr_type.from_arg_list(args)
175
176
177class BigQuery(Dialect):
178    UNNEST_COLUMN_ONLY = True
179
180    # https://cloud.google.com/bigquery/docs/reference/standard-sql/lexical#case_sensitivity
181    RESOLVES_IDENTIFIERS_AS_UPPERCASE = None
182
183    # bigquery udfs are case sensitive
184    NORMALIZE_FUNCTIONS = False
185
186    TIME_MAPPING = {
187        "%D": "%m/%d/%y",
188    }
189
190    FORMAT_MAPPING = {
191        "DD": "%d",
192        "MM": "%m",
193        "MON": "%b",
194        "MONTH": "%B",
195        "YYYY": "%Y",
196        "YY": "%y",
197        "HH": "%I",
198        "HH12": "%I",
199        "HH24": "%H",
200        "MI": "%M",
201        "SS": "%S",
202        "SSSSS": "%f",
203        "TZH": "%z",
204    }
205
206    @classmethod
207    def normalize_identifier(cls, expression: E) -> E:
208        # In BigQuery, CTEs aren't case-sensitive, but table names are (by default, at least).
209        # The following check is essentially a heuristic to detect tables based on whether or
210        # not they're qualified.
211        if isinstance(expression, exp.Identifier):
212            parent = expression.parent
213
214            while isinstance(parent, exp.Dot):
215                parent = parent.parent
216
217            if (
218                not isinstance(parent, exp.UserDefinedFunction)
219                and not (isinstance(parent, exp.Table) and parent.db)
220                and not expression.meta.get("is_table")
221            ):
222                expression.set("this", expression.this.lower())
223
224        return expression
225
226    class Tokenizer(tokens.Tokenizer):
227        QUOTES = ["'", '"', '"""', "'''"]
228        COMMENTS = ["--", "#", ("/*", "*/")]
229        IDENTIFIERS = ["`"]
230        STRING_ESCAPES = ["\\"]
231
232        HEX_STRINGS = [("0x", ""), ("0X", "")]
233
234        BYTE_STRINGS = [
235            (prefix + q, q) for q in t.cast(t.List[str], QUOTES) for prefix in ("b", "B")
236        ]
237
238        RAW_STRINGS = [
239            (prefix + q, q) for q in t.cast(t.List[str], QUOTES) for prefix in ("r", "R")
240        ]
241
242        KEYWORDS = {
243            **tokens.Tokenizer.KEYWORDS,
244            "ANY TYPE": TokenType.VARIANT,
245            "BEGIN": TokenType.COMMAND,
246            "BEGIN TRANSACTION": TokenType.BEGIN,
247            "CURRENT_DATETIME": TokenType.CURRENT_DATETIME,
248            "BYTES": TokenType.BINARY,
249            "DECLARE": TokenType.COMMAND,
250            "FLOAT64": TokenType.DOUBLE,
251            "INT64": TokenType.BIGINT,
252            "RECORD": TokenType.STRUCT,
253            "TIMESTAMP": TokenType.TIMESTAMPTZ,
254            "NOT DETERMINISTIC": TokenType.VOLATILE,
255            "UNKNOWN": TokenType.NULL,
256        }
257        KEYWORDS.pop("DIV")
258
259    class Parser(parser.Parser):
260        PREFIXED_PIVOT_COLUMNS = True
261
262        LOG_BASE_FIRST = False
263        LOG_DEFAULTS_TO_LN = True
264
265        FUNCTIONS = {
266            **parser.Parser.FUNCTIONS,
267            "DATE": _parse_date,
268            "DATE_ADD": parse_date_delta_with_interval(exp.DateAdd),
269            "DATE_SUB": parse_date_delta_with_interval(exp.DateSub),
270            "DATE_TRUNC": lambda args: exp.DateTrunc(
271                unit=exp.Literal.string(str(seq_get(args, 1))),
272                this=seq_get(args, 0),
273            ),
274            "DATETIME_ADD": parse_date_delta_with_interval(exp.DatetimeAdd),
275            "DATETIME_SUB": parse_date_delta_with_interval(exp.DatetimeSub),
276            "DIV": lambda args: exp.IntDiv(this=seq_get(args, 0), expression=seq_get(args, 1)),
277            "GENERATE_ARRAY": exp.GenerateSeries.from_arg_list,
278            "PARSE_DATE": lambda args: format_time_lambda(exp.StrToDate, "bigquery")(
279                [seq_get(args, 1), seq_get(args, 0)]
280            ),
281            "PARSE_TIMESTAMP": _parse_timestamp,
282            "REGEXP_CONTAINS": exp.RegexpLike.from_arg_list,
283            "REGEXP_EXTRACT": lambda args: exp.RegexpExtract(
284                this=seq_get(args, 0),
285                expression=seq_get(args, 1),
286                position=seq_get(args, 2),
287                occurrence=seq_get(args, 3),
288                group=exp.Literal.number(1)
289                if re.compile(str(seq_get(args, 1))).groups == 1
290                else None,
291            ),
292            "SPLIT": lambda args: exp.Split(
293                # https://cloud.google.com/bigquery/docs/reference/standard-sql/string_functions#split
294                this=seq_get(args, 0),
295                expression=seq_get(args, 1) or exp.Literal.string(","),
296            ),
297            "TIME_ADD": parse_date_delta_with_interval(exp.TimeAdd),
298            "TIME_SUB": parse_date_delta_with_interval(exp.TimeSub),
299            "TIMESTAMP_ADD": parse_date_delta_with_interval(exp.TimestampAdd),
300            "TIMESTAMP_SUB": parse_date_delta_with_interval(exp.TimestampSub),
301            "TO_JSON_STRING": exp.JSONFormat.from_arg_list,
302        }
303
304        FUNCTION_PARSERS = {
305            **parser.Parser.FUNCTION_PARSERS,
306            "ARRAY": lambda self: self.expression(exp.Array, expressions=[self._parse_statement()]),
307        }
308        FUNCTION_PARSERS.pop("TRIM")
309
310        NO_PAREN_FUNCTIONS = {
311            **parser.Parser.NO_PAREN_FUNCTIONS,
312            TokenType.CURRENT_DATETIME: exp.CurrentDatetime,
313        }
314
315        NESTED_TYPE_TOKENS = {
316            *parser.Parser.NESTED_TYPE_TOKENS,
317            TokenType.TABLE,
318        }
319
320        ID_VAR_TOKENS = {
321            *parser.Parser.ID_VAR_TOKENS,
322            TokenType.VALUES,
323        }
324
325        PROPERTY_PARSERS = {
326            **parser.Parser.PROPERTY_PARSERS,
327            "NOT DETERMINISTIC": lambda self: self.expression(
328                exp.StabilityProperty, this=exp.Literal.string("VOLATILE")
329            ),
330            "OPTIONS": lambda self: self._parse_with_property(),
331        }
332
333        CONSTRAINT_PARSERS = {
334            **parser.Parser.CONSTRAINT_PARSERS,
335            "OPTIONS": lambda self: exp.Properties(expressions=self._parse_with_property()),
336        }
337
338        def _parse_table_part(self, schema: bool = False) -> t.Optional[exp.Expression]:
339            this = super()._parse_table_part(schema=schema)
340
341            # https://cloud.google.com/bigquery/docs/reference/standard-sql/lexical#table_names
342            if isinstance(this, exp.Identifier):
343                table_name = this.name
344                while self._match(TokenType.DASH, advance=False) and self._next:
345                    self._advance(2)
346                    table_name += f"-{self._prev.text}"
347
348                this = exp.Identifier(this=table_name, quoted=this.args.get("quoted"))
349
350            return this
351
352        def _parse_table_parts(self, schema: bool = False) -> exp.Table:
353            table = super()._parse_table_parts(schema=schema)
354            if isinstance(table.this, exp.Identifier) and "." in table.name:
355                catalog, db, this, *rest = (
356                    t.cast(t.Optional[exp.Expression], exp.to_identifier(x))
357                    for x in split_num_words(table.name, ".", 3)
358                )
359
360                if rest and this:
361                    this = exp.Dot.build(t.cast(t.List[exp.Expression], [this, *rest]))
362
363                table = exp.Table(this=this, db=db, catalog=catalog)
364
365            return table
366
367    class Generator(generator.Generator):
368        EXPLICIT_UNION = True
369        INTERVAL_ALLOWS_PLURAL_FORM = False
370        JOIN_HINTS = False
371        QUERY_HINTS = False
372        TABLE_HINTS = False
373        LIMIT_FETCH = "LIMIT"
374        RENAME_TABLE_WITH_DB = False
375        ESCAPE_LINE_BREAK = True
376
377        TRANSFORMS = {
378            **generator.Generator.TRANSFORMS,
379            exp.ApproxDistinct: rename_func("APPROX_COUNT_DISTINCT"),
380            exp.ArraySize: rename_func("ARRAY_LENGTH"),
381            exp.Cast: transforms.preprocess([transforms.remove_precision_parameterized_types]),
382            exp.CTE: transforms.preprocess([_pushdown_cte_column_names]),
383            exp.DateAdd: _date_add_sql("DATE", "ADD"),
384            exp.DateFromParts: rename_func("DATE"),
385            exp.DateSub: _date_add_sql("DATE", "SUB"),
386            exp.DatetimeAdd: _date_add_sql("DATETIME", "ADD"),
387            exp.DatetimeSub: _date_add_sql("DATETIME", "SUB"),
388            exp.DateDiff: lambda self, e: f"DATE_DIFF({self.sql(e, 'this')}, {self.sql(e, 'expression')}, {self.sql(e.args.get('unit', 'DAY'))})",
389            exp.DateStrToDate: datestrtodate_sql,
390            exp.DateTrunc: lambda self, e: self.func("DATE_TRUNC", e.this, e.text("unit")),
391            exp.JSONFormat: rename_func("TO_JSON_STRING"),
392            exp.GenerateSeries: rename_func("GENERATE_ARRAY"),
393            exp.GroupConcat: rename_func("STRING_AGG"),
394            exp.ILike: no_ilike_sql,
395            exp.IntDiv: rename_func("DIV"),
396            exp.Max: max_or_greatest,
397            exp.Min: min_or_least,
398            exp.RegexpExtract: lambda self, e: self.func(
399                "REGEXP_EXTRACT",
400                e.this,
401                e.expression,
402                e.args.get("position"),
403                e.args.get("occurrence"),
404            ),
405            exp.RegexpLike: rename_func("REGEXP_CONTAINS"),
406            exp.Select: transforms.preprocess(
407                [
408                    transforms.explode_to_unnest,
409                    _unqualify_unnest,
410                    transforms.eliminate_distinct_on,
411                    _alias_ordered_group,
412                ]
413            ),
414            exp.StrToDate: lambda self, e: f"PARSE_DATE({self.format_time(e)}, {self.sql(e, 'this')})",
415            exp.StrToTime: lambda self, e: self.func(
416                "PARSE_TIMESTAMP", self.format_time(e), e.this, e.args.get("zone")
417            ),
418            exp.TimeAdd: _date_add_sql("TIME", "ADD"),
419            exp.TimeSub: _date_add_sql("TIME", "SUB"),
420            exp.TimestampAdd: _date_add_sql("TIMESTAMP", "ADD"),
421            exp.TimestampSub: _date_add_sql("TIMESTAMP", "SUB"),
422            exp.TimeStrToTime: timestrtotime_sql,
423            exp.TsOrDsToDate: ts_or_ds_to_date_sql("bigquery"),
424            exp.TsOrDsAdd: _date_add_sql("DATE", "ADD"),
425            exp.PartitionedByProperty: lambda self, e: f"PARTITION BY {self.sql(e, 'this')}",
426            exp.VariancePop: rename_func("VAR_POP"),
427            exp.Values: _derived_table_values_to_unnest,
428            exp.ReturnsProperty: _returnsproperty_sql,
429            exp.Create: _create_sql,
430            exp.Trim: lambda self, e: self.func(f"TRIM", e.this, e.expression),
431            exp.StabilityProperty: lambda self, e: f"DETERMINISTIC"
432            if e.name == "IMMUTABLE"
433            else "NOT DETERMINISTIC",
434        }
435
436        TYPE_MAPPING = {
437            **generator.Generator.TYPE_MAPPING,
438            exp.DataType.Type.BIGDECIMAL: "BIGNUMERIC",
439            exp.DataType.Type.BIGINT: "INT64",
440            exp.DataType.Type.BINARY: "BYTES",
441            exp.DataType.Type.BOOLEAN: "BOOL",
442            exp.DataType.Type.CHAR: "STRING",
443            exp.DataType.Type.DECIMAL: "NUMERIC",
444            exp.DataType.Type.DOUBLE: "FLOAT64",
445            exp.DataType.Type.FLOAT: "FLOAT64",
446            exp.DataType.Type.INT: "INT64",
447            exp.DataType.Type.NCHAR: "STRING",
448            exp.DataType.Type.NVARCHAR: "STRING",
449            exp.DataType.Type.SMALLINT: "INT64",
450            exp.DataType.Type.TEXT: "STRING",
451            exp.DataType.Type.TIMESTAMP: "DATETIME",
452            exp.DataType.Type.TIMESTAMPTZ: "TIMESTAMP",
453            exp.DataType.Type.TIMESTAMPLTZ: "TIMESTAMP",
454            exp.DataType.Type.TINYINT: "INT64",
455            exp.DataType.Type.VARBINARY: "BYTES",
456            exp.DataType.Type.VARCHAR: "STRING",
457            exp.DataType.Type.VARIANT: "ANY TYPE",
458        }
459
460        PROPERTIES_LOCATION = {
461            **generator.Generator.PROPERTIES_LOCATION,
462            exp.PartitionedByProperty: exp.Properties.Location.POST_SCHEMA,
463            exp.VolatileProperty: exp.Properties.Location.UNSUPPORTED,
464        }
465
466        # from: https://cloud.google.com/bigquery/docs/reference/standard-sql/lexical#reserved_keywords
467        RESERVED_KEYWORDS = {
468            *generator.Generator.RESERVED_KEYWORDS,
469            "all",
470            "and",
471            "any",
472            "array",
473            "as",
474            "asc",
475            "assert_rows_modified",
476            "at",
477            "between",
478            "by",
479            "case",
480            "cast",
481            "collate",
482            "contains",
483            "create",
484            "cross",
485            "cube",
486            "current",
487            "default",
488            "define",
489            "desc",
490            "distinct",
491            "else",
492            "end",
493            "enum",
494            "escape",
495            "except",
496            "exclude",
497            "exists",
498            "extract",
499            "false",
500            "fetch",
501            "following",
502            "for",
503            "from",
504            "full",
505            "group",
506            "grouping",
507            "groups",
508            "hash",
509            "having",
510            "if",
511            "ignore",
512            "in",
513            "inner",
514            "intersect",
515            "interval",
516            "into",
517            "is",
518            "join",
519            "lateral",
520            "left",
521            "like",
522            "limit",
523            "lookup",
524            "merge",
525            "natural",
526            "new",
527            "no",
528            "not",
529            "null",
530            "nulls",
531            "of",
532            "on",
533            "or",
534            "order",
535            "outer",
536            "over",
537            "partition",
538            "preceding",
539            "proto",
540            "qualify",
541            "range",
542            "recursive",
543            "respect",
544            "right",
545            "rollup",
546            "rows",
547            "select",
548            "set",
549            "some",
550            "struct",
551            "tablesample",
552            "then",
553            "to",
554            "treat",
555            "true",
556            "unbounded",
557            "union",
558            "unnest",
559            "using",
560            "when",
561            "where",
562            "window",
563            "with",
564            "within",
565        }
566
567        def attimezone_sql(self, expression: exp.AtTimeZone) -> str:
568            parent = expression.parent
569
570            # BigQuery allows CAST(.. AS {STRING|TIMESTAMP} [FORMAT <fmt> [AT TIME ZONE <tz>]]).
571            # Only the TIMESTAMP one should use the below conversion, when AT TIME ZONE is included.
572            if not isinstance(parent, exp.Cast) or not parent.to.is_type("text"):
573                return self.func(
574                    "TIMESTAMP", self.func("DATETIME", expression.this, expression.args.get("zone"))
575                )
576
577            return super().attimezone_sql(expression)
578
579        def trycast_sql(self, expression: exp.TryCast) -> str:
580            return self.cast_sql(expression, safe_prefix="SAFE_")
581
582        def cte_sql(self, expression: exp.CTE) -> str:
583            if expression.alias_column_names:
584                self.unsupported("Column names in CTE definition are not supported.")
585            return super().cte_sql(expression)
586
587        def array_sql(self, expression: exp.Array) -> str:
588            first_arg = seq_get(expression.expressions, 0)
589            if isinstance(first_arg, exp.Subqueryable):
590                return f"ARRAY{self.wrap(self.sql(first_arg))}"
591
592            return inline_array_sql(self, expression)
593
594        def transaction_sql(self, *_) -> str:
595            return "BEGIN TRANSACTION"
596
597        def commit_sql(self, *_) -> str:
598            return "COMMIT TRANSACTION"
599
600        def rollback_sql(self, *_) -> str:
601            return "ROLLBACK TRANSACTION"
602
603        def in_unnest_op(self, expression: exp.Unnest) -> str:
604            return self.sql(expression)
605
606        def except_op(self, expression: exp.Except) -> str:
607            if not expression.args.get("distinct", False):
608                self.unsupported("EXCEPT without DISTINCT is not supported in BigQuery")
609            return f"EXCEPT{' DISTINCT' if expression.args.get('distinct') else ' ALL'}"
610
611        def intersect_op(self, expression: exp.Intersect) -> str:
612            if not expression.args.get("distinct", False):
613                self.unsupported("INTERSECT without DISTINCT is not supported in BigQuery")
614            return f"INTERSECT{' DISTINCT' if expression.args.get('distinct') else ' ALL'}"
615
616        def with_properties(self, properties: exp.Properties) -> str:
617            return self.properties(properties, prefix=self.seg("OPTIONS"))

logger = <Logger sqlglot (WARNING)>

class BigQuery(sqlglot.dialects.dialect.Dialect): View Source

178class BigQuery(Dialect):
179    UNNEST_COLUMN_ONLY = True
180
181    # https://cloud.google.com/bigquery/docs/reference/standard-sql/lexical#case_sensitivity
182    RESOLVES_IDENTIFIERS_AS_UPPERCASE = None
183
184    # bigquery udfs are case sensitive
185    NORMALIZE_FUNCTIONS = False
186
187    TIME_MAPPING = {
188        "%D": "%m/%d/%y",
189    }
190
191    FORMAT_MAPPING = {
192        "DD": "%d",
193        "MM": "%m",
194        "MON": "%b",
195        "MONTH": "%B",
196        "YYYY": "%Y",
197        "YY": "%y",
198        "HH": "%I",
199        "HH12": "%I",
200        "HH24": "%H",
201        "MI": "%M",
202        "SS": "%S",
203        "SSSSS": "%f",
204        "TZH": "%z",
205    }
206
207    @classmethod
208    def normalize_identifier(cls, expression: E) -> E:
209        # In BigQuery, CTEs aren't case-sensitive, but table names are (by default, at least).
210        # The following check is essentially a heuristic to detect tables based on whether or
211        # not they're qualified.
212        if isinstance(expression, exp.Identifier):
213            parent = expression.parent
214
215            while isinstance(parent, exp.Dot):
216                parent = parent.parent
217
218            if (
219                not isinstance(parent, exp.UserDefinedFunction)
220                and not (isinstance(parent, exp.Table) and parent.db)
221                and not expression.meta.get("is_table")
222            ):
223                expression.set("this", expression.this.lower())
224
225        return expression
226
227    class Tokenizer(tokens.Tokenizer):
228        QUOTES = ["'", '"', '"""', "'''"]
229        COMMENTS = ["--", "#", ("/*", "*/")]
230        IDENTIFIERS = ["`"]
231        STRING_ESCAPES = ["\\"]
232
233        HEX_STRINGS = [("0x", ""), ("0X", "")]
234
235        BYTE_STRINGS = [
236            (prefix + q, q) for q in t.cast(t.List[str], QUOTES) for prefix in ("b", "B")
237        ]
238
239        RAW_STRINGS = [
240            (prefix + q, q) for q in t.cast(t.List[str], QUOTES) for prefix in ("r", "R")
241        ]
242
243        KEYWORDS = {
244            **tokens.Tokenizer.KEYWORDS,
245            "ANY TYPE": TokenType.VARIANT,
246            "BEGIN": TokenType.COMMAND,
247            "BEGIN TRANSACTION": TokenType.BEGIN,
248            "CURRENT_DATETIME": TokenType.CURRENT_DATETIME,
249            "BYTES": TokenType.BINARY,
250            "DECLARE": TokenType.COMMAND,
251            "FLOAT64": TokenType.DOUBLE,
252            "INT64": TokenType.BIGINT,
253            "RECORD": TokenType.STRUCT,
254            "TIMESTAMP": TokenType.TIMESTAMPTZ,
255            "NOT DETERMINISTIC": TokenType.VOLATILE,
256            "UNKNOWN": TokenType.NULL,
257        }
258        KEYWORDS.pop("DIV")
259
260    class Parser(parser.Parser):
261        PREFIXED_PIVOT_COLUMNS = True
262
263        LOG_BASE_FIRST = False
264        LOG_DEFAULTS_TO_LN = True
265
266        FUNCTIONS = {
267            **parser.Parser.FUNCTIONS,
268            "DATE": _parse_date,
269            "DATE_ADD": parse_date_delta_with_interval(exp.DateAdd),
270            "DATE_SUB": parse_date_delta_with_interval(exp.DateSub),
271            "DATE_TRUNC": lambda args: exp.DateTrunc(
272                unit=exp.Literal.string(str(seq_get(args, 1))),
273                this=seq_get(args, 0),
274            ),
275            "DATETIME_ADD": parse_date_delta_with_interval(exp.DatetimeAdd),
276            "DATETIME_SUB": parse_date_delta_with_interval(exp.DatetimeSub),
277            "DIV": lambda args: exp.IntDiv(this=seq_get(args, 0), expression=seq_get(args, 1)),
278            "GENERATE_ARRAY": exp.GenerateSeries.from_arg_list,
279            "PARSE_DATE": lambda args: format_time_lambda(exp.StrToDate, "bigquery")(
280                [seq_get(args, 1), seq_get(args, 0)]
281            ),
282            "PARSE_TIMESTAMP": _parse_timestamp,
283            "REGEXP_CONTAINS": exp.RegexpLike.from_arg_list,
284            "REGEXP_EXTRACT": lambda args: exp.RegexpExtract(
285                this=seq_get(args, 0),
286                expression=seq_get(args, 1),
287                position=seq_get(args, 2),
288                occurrence=seq_get(args, 3),
289                group=exp.Literal.number(1)
290                if re.compile(str(seq_get(args, 1))).groups == 1
291                else None,
292            ),
293            "SPLIT": lambda args: exp.Split(
294                # https://cloud.google.com/bigquery/docs/reference/standard-sql/string_functions#split
295                this=seq_get(args, 0),
296                expression=seq_get(args, 1) or exp.Literal.string(","),
297            ),
298            "TIME_ADD": parse_date_delta_with_interval(exp.TimeAdd),
299            "TIME_SUB": parse_date_delta_with_interval(exp.TimeSub),
300            "TIMESTAMP_ADD": parse_date_delta_with_interval(exp.TimestampAdd),
301            "TIMESTAMP_SUB": parse_date_delta_with_interval(exp.TimestampSub),
302            "TO_JSON_STRING": exp.JSONFormat.from_arg_list,
303        }
304
305        FUNCTION_PARSERS = {
306            **parser.Parser.FUNCTION_PARSERS,
307            "ARRAY": lambda self: self.expression(exp.Array, expressions=[self._parse_statement()]),
308        }
309        FUNCTION_PARSERS.pop("TRIM")
310
311        NO_PAREN_FUNCTIONS = {
312            **parser.Parser.NO_PAREN_FUNCTIONS,
313            TokenType.CURRENT_DATETIME: exp.CurrentDatetime,
314        }
315
316        NESTED_TYPE_TOKENS = {
317            *parser.Parser.NESTED_TYPE_TOKENS,
318            TokenType.TABLE,
319        }
320
321        ID_VAR_TOKENS = {
322            *parser.Parser.ID_VAR_TOKENS,
323            TokenType.VALUES,
324        }
325
326        PROPERTY_PARSERS = {
327            **parser.Parser.PROPERTY_PARSERS,
328            "NOT DETERMINISTIC": lambda self: self.expression(
329                exp.StabilityProperty, this=exp.Literal.string("VOLATILE")
330            ),
331            "OPTIONS": lambda self: self._parse_with_property(),
332        }
333
334        CONSTRAINT_PARSERS = {
335            **parser.Parser.CONSTRAINT_PARSERS,
336            "OPTIONS": lambda self: exp.Properties(expressions=self._parse_with_property()),
337        }
338
339        def _parse_table_part(self, schema: bool = False) -> t.Optional[exp.Expression]:
340            this = super()._parse_table_part(schema=schema)
341
342            # https://cloud.google.com/bigquery/docs/reference/standard-sql/lexical#table_names
343            if isinstance(this, exp.Identifier):
344                table_name = this.name
345                while self._match(TokenType.DASH, advance=False) and self._next:
346                    self._advance(2)
347                    table_name += f"-{self._prev.text}"
348
349                this = exp.Identifier(this=table_name, quoted=this.args.get("quoted"))
350
351            return this
352
353        def _parse_table_parts(self, schema: bool = False) -> exp.Table:
354            table = super()._parse_table_parts(schema=schema)
355            if isinstance(table.this, exp.Identifier) and "." in table.name:
356                catalog, db, this, *rest = (
357                    t.cast(t.Optional[exp.Expression], exp.to_identifier(x))
358                    for x in split_num_words(table.name, ".", 3)
359                )
360
361                if rest and this:
362                    this = exp.Dot.build(t.cast(t.List[exp.Expression], [this, *rest]))
363
364                table = exp.Table(this=this, db=db, catalog=catalog)
365
366            return table
367
368    class Generator(generator.Generator):
369        EXPLICIT_UNION = True
370        INTERVAL_ALLOWS_PLURAL_FORM = False
371        JOIN_HINTS = False
372        QUERY_HINTS = False
373        TABLE_HINTS = False
374        LIMIT_FETCH = "LIMIT"
375        RENAME_TABLE_WITH_DB = False
376        ESCAPE_LINE_BREAK = True
377
378        TRANSFORMS = {
379            **generator.Generator.TRANSFORMS,
380            exp.ApproxDistinct: rename_func("APPROX_COUNT_DISTINCT"),
381            exp.ArraySize: rename_func("ARRAY_LENGTH"),
382            exp.Cast: transforms.preprocess([transforms.remove_precision_parameterized_types]),
383            exp.CTE: transforms.preprocess([_pushdown_cte_column_names]),
384            exp.DateAdd: _date_add_sql("DATE", "ADD"),
385            exp.DateFromParts: rename_func("DATE"),
386            exp.DateSub: _date_add_sql("DATE", "SUB"),
387            exp.DatetimeAdd: _date_add_sql("DATETIME", "ADD"),
388            exp.DatetimeSub: _date_add_sql("DATETIME", "SUB"),
389            exp.DateDiff: lambda self, e: f"DATE_DIFF({self.sql(e, 'this')}, {self.sql(e, 'expression')}, {self.sql(e.args.get('unit', 'DAY'))})",
390            exp.DateStrToDate: datestrtodate_sql,
391            exp.DateTrunc: lambda self, e: self.func("DATE_TRUNC", e.this, e.text("unit")),
392            exp.JSONFormat: rename_func("TO_JSON_STRING"),
393            exp.GenerateSeries: rename_func("GENERATE_ARRAY"),
394            exp.GroupConcat: rename_func("STRING_AGG"),
395            exp.ILike: no_ilike_sql,
396            exp.IntDiv: rename_func("DIV"),
397            exp.Max: max_or_greatest,
398            exp.Min: min_or_least,
399            exp.RegexpExtract: lambda self, e: self.func(
400                "REGEXP_EXTRACT",
401                e.this,
402                e.expression,
403                e.args.get("position"),
404                e.args.get("occurrence"),
405            ),
406            exp.RegexpLike: rename_func("REGEXP_CONTAINS"),
407            exp.Select: transforms.preprocess(
408                [
409                    transforms.explode_to_unnest,
410                    _unqualify_unnest,
411                    transforms.eliminate_distinct_on,
412                    _alias_ordered_group,
413                ]
414            ),
415            exp.StrToDate: lambda self, e: f"PARSE_DATE({self.format_time(e)}, {self.sql(e, 'this')})",
416            exp.StrToTime: lambda self, e: self.func(
417                "PARSE_TIMESTAMP", self.format_time(e), e.this, e.args.get("zone")
418            ),
419            exp.TimeAdd: _date_add_sql("TIME", "ADD"),
420            exp.TimeSub: _date_add_sql("TIME", "SUB"),
421            exp.TimestampAdd: _date_add_sql("TIMESTAMP", "ADD"),
422            exp.TimestampSub: _date_add_sql("TIMESTAMP", "SUB"),
423            exp.TimeStrToTime: timestrtotime_sql,
424            exp.TsOrDsToDate: ts_or_ds_to_date_sql("bigquery"),
425            exp.TsOrDsAdd: _date_add_sql("DATE", "ADD"),
426            exp.PartitionedByProperty: lambda self, e: f"PARTITION BY {self.sql(e, 'this')}",
427            exp.VariancePop: rename_func("VAR_POP"),
428            exp.Values: _derived_table_values_to_unnest,
429            exp.ReturnsProperty: _returnsproperty_sql,
430            exp.Create: _create_sql,
431            exp.Trim: lambda self, e: self.func(f"TRIM", e.this, e.expression),
432            exp.StabilityProperty: lambda self, e: f"DETERMINISTIC"
433            if e.name == "IMMUTABLE"
434            else "NOT DETERMINISTIC",
435        }
436
437        TYPE_MAPPING = {
438            **generator.Generator.TYPE_MAPPING,
439            exp.DataType.Type.BIGDECIMAL: "BIGNUMERIC",
440            exp.DataType.Type.BIGINT: "INT64",
441            exp.DataType.Type.BINARY: "BYTES",
442            exp.DataType.Type.BOOLEAN: "BOOL",
443            exp.DataType.Type.CHAR: "STRING",
444            exp.DataType.Type.DECIMAL: "NUMERIC",
445            exp.DataType.Type.DOUBLE: "FLOAT64",
446            exp.DataType.Type.FLOAT: "FLOAT64",
447            exp.DataType.Type.INT: "INT64",
448            exp.DataType.Type.NCHAR: "STRING",
449            exp.DataType.Type.NVARCHAR: "STRING",
450            exp.DataType.Type.SMALLINT: "INT64",
451            exp.DataType.Type.TEXT: "STRING",
452            exp.DataType.Type.TIMESTAMP: "DATETIME",
453            exp.DataType.Type.TIMESTAMPTZ: "TIMESTAMP",
454            exp.DataType.Type.TIMESTAMPLTZ: "TIMESTAMP",
455            exp.DataType.Type.TINYINT: "INT64",
456            exp.DataType.Type.VARBINARY: "BYTES",
457            exp.DataType.Type.VARCHAR: "STRING",
458            exp.DataType.Type.VARIANT: "ANY TYPE",
459        }
460
461        PROPERTIES_LOCATION = {
462            **generator.Generator.PROPERTIES_LOCATION,
463            exp.PartitionedByProperty: exp.Properties.Location.POST_SCHEMA,
464            exp.VolatileProperty: exp.Properties.Location.UNSUPPORTED,
465        }
466
467        # from: https://cloud.google.com/bigquery/docs/reference/standard-sql/lexical#reserved_keywords
468        RESERVED_KEYWORDS = {
469            *generator.Generator.RESERVED_KEYWORDS,
470            "all",
471            "and",
472            "any",
473            "array",
474            "as",
475            "asc",
476            "assert_rows_modified",
477            "at",
478            "between",
479            "by",
480            "case",
481            "cast",
482            "collate",
483            "contains",
484            "create",
485            "cross",
486            "cube",
487            "current",
488            "default",
489            "define",
490            "desc",
491            "distinct",
492            "else",
493            "end",
494            "enum",
495            "escape",
496            "except",
497            "exclude",
498            "exists",
499            "extract",
500            "false",
501            "fetch",
502            "following",
503            "for",
504            "from",
505            "full",
506            "group",
507            "grouping",
508            "groups",
509            "hash",
510            "having",
511            "if",
512            "ignore",
513            "in",
514            "inner",
515            "intersect",
516            "interval",
517            "into",
518            "is",
519            "join",
520            "lateral",
521            "left",
522            "like",
523            "limit",
524            "lookup",
525            "merge",
526            "natural",
527            "new",
528            "no",
529            "not",
530            "null",
531            "nulls",
532            "of",
533            "on",
534            "or",
535            "order",
536            "outer",
537            "over",
538            "partition",
539            "preceding",
540            "proto",
541            "qualify",
542            "range",
543            "recursive",
544            "respect",
545            "right",
546            "rollup",
547            "rows",
548            "select",
549            "set",
550            "some",
551            "struct",
552            "tablesample",
553            "then",
554            "to",
555            "treat",
556            "true",
557            "unbounded",
558            "union",
559            "unnest",
560            "using",
561            "when",
562            "where",
563            "window",
564            "with",
565            "within",
566        }
567
568        def attimezone_sql(self, expression: exp.AtTimeZone) -> str:
569            parent = expression.parent
570
571            # BigQuery allows CAST(.. AS {STRING|TIMESTAMP} [FORMAT <fmt> [AT TIME ZONE <tz>]]).
572            # Only the TIMESTAMP one should use the below conversion, when AT TIME ZONE is included.
573            if not isinstance(parent, exp.Cast) or not parent.to.is_type("text"):
574                return self.func(
575                    "TIMESTAMP", self.func("DATETIME", expression.this, expression.args.get("zone"))
576                )
577
578            return super().attimezone_sql(expression)
579
580        def trycast_sql(self, expression: exp.TryCast) -> str:
581            return self.cast_sql(expression, safe_prefix="SAFE_")
582
583        def cte_sql(self, expression: exp.CTE) -> str:
584            if expression.alias_column_names:
585                self.unsupported("Column names in CTE definition are not supported.")
586            return super().cte_sql(expression)
587
588        def array_sql(self, expression: exp.Array) -> str:
589            first_arg = seq_get(expression.expressions, 0)
590            if isinstance(first_arg, exp.Subqueryable):
591                return f"ARRAY{self.wrap(self.sql(first_arg))}"
592
593            return inline_array_sql(self, expression)
594
595        def transaction_sql(self, *_) -> str:
596            return "BEGIN TRANSACTION"
597
598        def commit_sql(self, *_) -> str:
599            return "COMMIT TRANSACTION"
600
601        def rollback_sql(self, *_) -> str:
602            return "ROLLBACK TRANSACTION"
603
604        def in_unnest_op(self, expression: exp.Unnest) -> str:
605            return self.sql(expression)
606
607        def except_op(self, expression: exp.Except) -> str:
608            if not expression.args.get("distinct", False):
609                self.unsupported("EXCEPT without DISTINCT is not supported in BigQuery")
610            return f"EXCEPT{' DISTINCT' if expression.args.get('distinct') else ' ALL'}"
611
612        def intersect_op(self, expression: exp.Intersect) -> str:
613            if not expression.args.get("distinct", False):
614                self.unsupported("INTERSECT without DISTINCT is not supported in BigQuery")
615            return f"INTERSECT{' DISTINCT' if expression.args.get('distinct') else ' ALL'}"
616
617        def with_properties(self, properties: exp.Properties) -> str:
618            return self.properties(properties, prefix=self.seg("OPTIONS"))

UNNEST_COLUMN_ONLY = True

RESOLVES_IDENTIFIERS_AS_UPPERCASE: Optional[bool] = None

NORMALIZE_FUNCTIONS: bool | str = False

TIME_MAPPING: Dict[str, str] = {'%D': '%m/%d/%y'}

FORMAT_MAPPING: Dict[str, str] = {'DD': '%d', 'MM': '%m', 'MON': '%b', 'MONTH': '%B', 'YYYY': '%Y', 'YY': '%y', 'HH': '%I', 'HH12': '%I', 'HH24': '%H', 'MI': '%M', 'SS': '%S', 'SSSSS': '%f', 'TZH': '%z'}

@classmethod

def normalize_identifier(cls, expression: ~E) -> ~E: View Source

207    @classmethod
208    def normalize_identifier(cls, expression: E) -> E:
209        # In BigQuery, CTEs aren't case-sensitive, but table names are (by default, at least).
210        # The following check is essentially a heuristic to detect tables based on whether or
211        # not they're qualified.
212        if isinstance(expression, exp.Identifier):
213            parent = expression.parent
214
215            while isinstance(parent, exp.Dot):
216                parent = parent.parent
217
218            if (
219                not isinstance(parent, exp.UserDefinedFunction)
220                and not (isinstance(parent, exp.Table) and parent.db)
221                and not expression.meta.get("is_table")
222            ):
223                expression.set("this", expression.this.lower())
224
225        return expression

Normalizes an unquoted identifier to either lower or upper case, thus essentially making it case-insensitive. If a dialect treats all identifiers as case-insensitive, they will be normalized regardless of being quoted or not.

tokenizer_class = <class 'sqlglot.dialects.bigquery.BigQuery.Tokenizer'>

parser_class = <class 'sqlglot.dialects.bigquery.BigQuery.Parser'>

generator_class = <class 'sqlglot.dialects.bigquery.BigQuery.Generator'>

TIME_TRIE: Dict = {'%': {'D': {0: True}}}

FORMAT_TRIE: Dict = {'D': {'D': {0: True}}, 'M': {'M': {0: True}, 'O': {'N': {0: True, 'T': {'H': {0: True}}}}, 'I': {0: True}}, 'Y': {'Y': {'Y': {'Y': {0: True}}, 0: True}}, 'H': {'H': {0: True, '1': {'2': {0: True}}, '2': {'4': {0: True}}}}, 'S': {'S': {0: True, 'S': {'S': {'S': {0: True}}}}}, 'T': {'Z': {'H': {0: True}}}}

INVERSE_TIME_MAPPING: Dict[str, str] = {'%m/%d/%y': '%D'}

INVERSE_TIME_TRIE: Dict = {'%': {'m': {'/': {'%': {'d': {'/': {'%': {'y': {0: True}}}}}}}}}

QUOTE_START = "'"

QUOTE_END = "'"

IDENTIFIER_START = '`'

IDENTIFIER_END = '`'

BIT_START = None

BIT_END = None

HEX_START = '0x'

HEX_END = ''

BYTE_START = "b'"

BYTE_END = "'"

Inherited Members

sqlglot.dialects.dialect.Dialect: INDEX_OFFSET; ALIAS_POST_TABLESAMPLE; IDENTIFIERS_CAN_START_WITH_DIGIT; STRICT_STRING_CONCAT; NULL_ORDERING; DATE_FORMAT; DATEINT_FORMAT; TIME_FORMAT; get_or_raise; format_time; case_sensitive; can_identify; quote_identifier; parse; parse_into; generate; transpile; tokenize; tokenizer; parser; generator

class BigQuery.Tokenizer(sqlglot.tokens.Tokenizer): View Source

227    class Tokenizer(tokens.Tokenizer):
228        QUOTES = ["'", '"', '"""', "'''"]
229        COMMENTS = ["--", "#", ("/*", "*/")]
230        IDENTIFIERS = ["`"]
231        STRING_ESCAPES = ["\\"]
232
233        HEX_STRINGS = [("0x", ""), ("0X", "")]
234
235        BYTE_STRINGS = [
236            (prefix + q, q) for q in t.cast(t.List[str], QUOTES) for prefix in ("b", "B")
237        ]
238
239        RAW_STRINGS = [
240            (prefix + q, q) for q in t.cast(t.List[str], QUOTES) for prefix in ("r", "R")
241        ]
242
243        KEYWORDS = {
244            **tokens.Tokenizer.KEYWORDS,
245            "ANY TYPE": TokenType.VARIANT,
246            "BEGIN": TokenType.COMMAND,
247            "BEGIN TRANSACTION": TokenType.BEGIN,
248            "CURRENT_DATETIME": TokenType.CURRENT_DATETIME,
249            "BYTES": TokenType.BINARY,
250            "DECLARE": TokenType.COMMAND,
251            "FLOAT64": TokenType.DOUBLE,
252            "INT64": TokenType.BIGINT,
253            "RECORD": TokenType.STRUCT,
254            "TIMESTAMP": TokenType.TIMESTAMPTZ,
255            "NOT DETERMINISTIC": TokenType.VOLATILE,
256            "UNKNOWN": TokenType.NULL,
257        }
258        KEYWORDS.pop("DIV")

QUOTES = ["'", '"', '"""', "'''"]

COMMENTS = ['--', '#', ('/*', '*/')]

IDENTIFIERS = ['`']

STRING_ESCAPES = ['\\']

HEX_STRINGS = [('0x', ''), ('0X', '')]

BYTE_STRINGS = [("b'", "'"), ("B'", "'"), ('b"', '"'), ('B"', '"'), ('b"""', '"""'), ('B"""', '"""'), ("b'''", "'''"), ("B'''", "'''")]

RAW_STRINGS = [("r'", "'"), ("R'", "'"), ('r"', '"'), ('R"', '"'), ('r"""', '"""'), ('R"""', '"""'), ("r'''", "'''"), ("R'''", "'''")]

KEYWORDS = {'{%': <TokenType.BLOCK_START: 'BLOCK_START'>, '{%+': <TokenType.BLOCK_START: 'BLOCK_START'>, '{%-': <TokenType.BLOCK_START: 'BLOCK_START'>, '%}': <TokenType.BLOCK_END: 'BLOCK_END'>, '+%}': <TokenType.BLOCK_END: 'BLOCK_END'>, '-%}': <TokenType.BLOCK_END: 'BLOCK_END'>, '{{+': <TokenType.BLOCK_START: 'BLOCK_START'>, '{{-': <TokenType.BLOCK_START: 'BLOCK_START'>, '+}}': <TokenType.BLOCK_END: 'BLOCK_END'>, '-}}': <TokenType.BLOCK_END: 'BLOCK_END'>, '/*+': <TokenType.HINT: 'HINT'>, '==': <TokenType.EQ: 'EQ'>, '::': <TokenType.DCOLON: 'DCOLON'>, '||': <TokenType.DPIPE: 'DPIPE'>, '>=': <TokenType.GTE: 'GTE'>, '<=': <TokenType.LTE: 'LTE'>, '<>': <TokenType.NEQ: 'NEQ'>, '!=': <TokenType.NEQ: 'NEQ'>, '<=>': <TokenType.NULLSAFE_EQ: 'NULLSAFE_EQ'>, '->': <TokenType.ARROW: 'ARROW'>, '->>': <TokenType.DARROW: 'DARROW'>, '=>': <TokenType.FARROW: 'FARROW'>, '#>': <TokenType.HASH_ARROW: 'HASH_ARROW'>, '#>>': <TokenType.DHASH_ARROW: 'DHASH_ARROW'>, '<->': <TokenType.LR_ARROW: 'LR_ARROW'>, '&&': <TokenType.DAMP: 'DAMP'>, 'ALL': <TokenType.ALL: 'ALL'>, 'ALWAYS': <TokenType.ALWAYS: 'ALWAYS'>, 'AND': <TokenType.AND: 'AND'>, 'ANTI': <TokenType.ANTI: 'ANTI'>, 'ANY': <TokenType.ANY: 'ANY'>, 'ASC': <TokenType.ASC: 'ASC'>, 'AS': <TokenType.ALIAS: 'ALIAS'>, 'ASOF': <TokenType.ASOF: 'ASOF'>, 'AUTOINCREMENT': <TokenType.AUTO_INCREMENT: 'AUTO_INCREMENT'>, 'AUTO_INCREMENT': <TokenType.AUTO_INCREMENT: 'AUTO_INCREMENT'>, 'BEGIN': <TokenType.COMMAND: 'COMMAND'>, 'BETWEEN': <TokenType.BETWEEN: 'BETWEEN'>, 'CACHE': <TokenType.CACHE: 'CACHE'>, 'UNCACHE': <TokenType.UNCACHE: 'UNCACHE'>, 'CASE': <TokenType.CASE: 'CASE'>, 'CHARACTER SET': <TokenType.CHARACTER_SET: 'CHARACTER_SET'>, 'CLUSTER BY': <TokenType.CLUSTER_BY: 'CLUSTER_BY'>, 'COLLATE': <TokenType.COLLATE: 'COLLATE'>, 'COLUMN': <TokenType.COLUMN: 'COLUMN'>, 'COMMIT': <TokenType.COMMIT: 'COMMIT'>, 'CONSTRAINT': <TokenType.CONSTRAINT: 'CONSTRAINT'>, 'CREATE': <TokenType.CREATE: 'CREATE'>, 'CROSS': <TokenType.CROSS: 'CROSS'>, 'CUBE': <TokenType.CUBE: 'CUBE'>, 'CURRENT_DATE': <TokenType.CURRENT_DATE: 'CURRENT_DATE'>, 'CURRENT_TIME': <TokenType.CURRENT_TIME: 'CURRENT_TIME'>, 'CURRENT_TIMESTAMP': <TokenType.CURRENT_TIMESTAMP: 'CURRENT_TIMESTAMP'>, 'CURRENT_USER': <TokenType.CURRENT_USER: 'CURRENT_USER'>, 'DATABASE': <TokenType.DATABASE: 'DATABASE'>, 'DEFAULT': <TokenType.DEFAULT: 'DEFAULT'>, 'DELETE': <TokenType.DELETE: 'DELETE'>, 'DESC': <TokenType.DESC: 'DESC'>, 'DESCRIBE': <TokenType.DESCRIBE: 'DESCRIBE'>, 'DISTINCT': <TokenType.DISTINCT: 'DISTINCT'>, 'DISTRIBUTE BY': <TokenType.DISTRIBUTE_BY: 'DISTRIBUTE_BY'>, 'DROP': <TokenType.DROP: 'DROP'>, 'ELSE': <TokenType.ELSE: 'ELSE'>, 'END': <TokenType.END: 'END'>, 'ESCAPE': <TokenType.ESCAPE: 'ESCAPE'>, 'EXCEPT': <TokenType.EXCEPT: 'EXCEPT'>, 'EXECUTE': <TokenType.EXECUTE: 'EXECUTE'>, 'EXISTS': <TokenType.EXISTS: 'EXISTS'>, 'FALSE': <TokenType.FALSE: 'FALSE'>, 'FETCH': <TokenType.FETCH: 'FETCH'>, 'FILTER': <TokenType.FILTER: 'FILTER'>, 'FIRST': <TokenType.FIRST: 'FIRST'>, 'FULL': <TokenType.FULL: 'FULL'>, 'FUNCTION': <TokenType.FUNCTION: 'FUNCTION'>, 'FOR': <TokenType.FOR: 'FOR'>, 'FOREIGN KEY': <TokenType.FOREIGN_KEY: 'FOREIGN_KEY'>, 'FORMAT': <TokenType.FORMAT: 'FORMAT'>, 'FROM': <TokenType.FROM: 'FROM'>, 'GEOGRAPHY': <TokenType.GEOGRAPHY: 'GEOGRAPHY'>, 'GEOMETRY': <TokenType.GEOMETRY: 'GEOMETRY'>, 'GLOB': <TokenType.GLOB: 'GLOB'>, 'GROUP BY': <TokenType.GROUP_BY: 'GROUP_BY'>, 'GROUPING SETS': <TokenType.GROUPING_SETS: 'GROUPING_SETS'>, 'HAVING': <TokenType.HAVING: 'HAVING'>, 'IF': <TokenType.IF: 'IF'>, 'ILIKE': <TokenType.ILIKE: 'ILIKE'>, 'IN': <TokenType.IN: 'IN'>, 'INDEX': <TokenType.INDEX: 'INDEX'>, 'INET': <TokenType.INET: 'INET'>, 'INNER': <TokenType.INNER: 'INNER'>, 'INSERT': <TokenType.INSERT: 'INSERT'>, 'INTERVAL': <TokenType.INTERVAL: 'INTERVAL'>, 'INTERSECT': <TokenType.INTERSECT: 'INTERSECT'>, 'INTO': <TokenType.INTO: 'INTO'>, 'IS': <TokenType.IS: 'IS'>, 'ISNULL': <TokenType.ISNULL: 'ISNULL'>, 'JOIN': <TokenType.JOIN: 'JOIN'>, 'KEEP': <TokenType.KEEP: 'KEEP'>, 'LATERAL': <TokenType.LATERAL: 'LATERAL'>, 'LEFT': <TokenType.LEFT: 'LEFT'>, 'LIKE': <TokenType.LIKE: 'LIKE'>, 'LIMIT': <TokenType.LIMIT: 'LIMIT'>, 'LOAD': <TokenType.LOAD: 'LOAD'>, 'LOCK': <TokenType.LOCK: 'LOCK'>, 'MERGE': <TokenType.MERGE: 'MERGE'>, 'NATURAL': <TokenType.NATURAL: 'NATURAL'>, 'NEXT': <TokenType.NEXT: 'NEXT'>, 'NEXT VALUE FOR': <TokenType.NEXT_VALUE_FOR: 'NEXT_VALUE_FOR'>, 'NOT': <TokenType.NOT: 'NOT'>, 'NOTNULL': <TokenType.NOTNULL: 'NOTNULL'>, 'NULL': <TokenType.NULL: 'NULL'>, 'OBJECT': <TokenType.OBJECT: 'OBJECT'>, 'OFFSET': <TokenType.OFFSET: 'OFFSET'>, 'ON': <TokenType.ON: 'ON'>, 'OR': <TokenType.OR: 'OR'>, 'ORDER BY': <TokenType.ORDER_BY: 'ORDER_BY'>, 'ORDINALITY': <TokenType.ORDINALITY: 'ORDINALITY'>, 'OUTER': <TokenType.OUTER: 'OUTER'>, 'OVER': <TokenType.OVER: 'OVER'>, 'OVERLAPS': <TokenType.OVERLAPS: 'OVERLAPS'>, 'OVERWRITE': <TokenType.OVERWRITE: 'OVERWRITE'>, 'PARTITION': <TokenType.PARTITION: 'PARTITION'>, 'PARTITION BY': <TokenType.PARTITION_BY: 'PARTITION_BY'>, 'PARTITIONED BY': <TokenType.PARTITION_BY: 'PARTITION_BY'>, 'PARTITIONED_BY': <TokenType.PARTITION_BY: 'PARTITION_BY'>, 'PERCENT': <TokenType.PERCENT: 'PERCENT'>, 'PIVOT': <TokenType.PIVOT: 'PIVOT'>, 'PRAGMA': <TokenType.PRAGMA: 'PRAGMA'>, 'PRIMARY KEY': <TokenType.PRIMARY_KEY: 'PRIMARY_KEY'>, 'PROCEDURE': <TokenType.PROCEDURE: 'PROCEDURE'>, 'QUALIFY': <TokenType.QUALIFY: 'QUALIFY'>, 'RANGE': <TokenType.RANGE: 'RANGE'>, 'RECURSIVE': <TokenType.RECURSIVE: 'RECURSIVE'>, 'REGEXP': <TokenType.RLIKE: 'RLIKE'>, 'REPLACE': <TokenType.REPLACE: 'REPLACE'>, 'RETURNING': <TokenType.RETURNING: 'RETURNING'>, 'REFERENCES': <TokenType.REFERENCES: 'REFERENCES'>, 'RIGHT': <TokenType.RIGHT: 'RIGHT'>, 'RLIKE': <TokenType.RLIKE: 'RLIKE'>, 'ROLLBACK': <TokenType.ROLLBACK: 'ROLLBACK'>, 'ROLLUP': <TokenType.ROLLUP: 'ROLLUP'>, 'ROW': <TokenType.ROW: 'ROW'>, 'ROWS': <TokenType.ROWS: 'ROWS'>, 'SCHEMA': <TokenType.SCHEMA: 'SCHEMA'>, 'SELECT': <TokenType.SELECT: 'SELECT'>, 'SEMI': <TokenType.SEMI: 'SEMI'>, 'SET': <TokenType.SET: 'SET'>, 'SETTINGS': <TokenType.SETTINGS: 'SETTINGS'>, 'SHOW': <TokenType.SHOW: 'SHOW'>, 'SIMILAR TO': <TokenType.SIMILAR_TO: 'SIMILAR_TO'>, 'SOME': <TokenType.SOME: 'SOME'>, 'SORT BY': <TokenType.SORT_BY: 'SORT_BY'>, 'TABLE': <TokenType.TABLE: 'TABLE'>, 'TABLESAMPLE': <TokenType.TABLE_SAMPLE: 'TABLE_SAMPLE'>, 'TEMP': <TokenType.TEMPORARY: 'TEMPORARY'>, 'TEMPORARY': <TokenType.TEMPORARY: 'TEMPORARY'>, 'THEN': <TokenType.THEN: 'THEN'>, 'TRUE': <TokenType.TRUE: 'TRUE'>, 'UNION': <TokenType.UNION: 'UNION'>, 'UNNEST': <TokenType.UNNEST: 'UNNEST'>, 'UNPIVOT': <TokenType.UNPIVOT: 'UNPIVOT'>, 'UPDATE': <TokenType.UPDATE: 'UPDATE'>, 'USE': <TokenType.USE: 'USE'>, 'USING': <TokenType.USING: 'USING'>, 'UUID': <TokenType.UUID: 'UUID'>, 'VALUES': <TokenType.VALUES: 'VALUES'>, 'VIEW': <TokenType.VIEW: 'VIEW'>, 'VOLATILE': <TokenType.VOLATILE: 'VOLATILE'>, 'WHEN': <TokenType.WHEN: 'WHEN'>, 'WHERE': <TokenType.WHERE: 'WHERE'>, 'WINDOW': <TokenType.WINDOW: 'WINDOW'>, 'WITH': <TokenType.WITH: 'WITH'>, 'APPLY': <TokenType.APPLY: 'APPLY'>, 'ARRAY': <TokenType.ARRAY: 'ARRAY'>, 'BIT': <TokenType.BIT: 'BIT'>, 'BOOL': <TokenType.BOOLEAN: 'BOOLEAN'>, 'BOOLEAN': <TokenType.BOOLEAN: 'BOOLEAN'>, 'BYTE': <TokenType.TINYINT: 'TINYINT'>, 'TINYINT': <TokenType.TINYINT: 'TINYINT'>, 'SHORT': <TokenType.SMALLINT: 'SMALLINT'>, 'SMALLINT': <TokenType.SMALLINT: 'SMALLINT'>, 'INT2': <TokenType.SMALLINT: 'SMALLINT'>, 'INTEGER': <TokenType.INT: 'INT'>, 'INT': <TokenType.INT: 'INT'>, 'INT4': <TokenType.INT: 'INT'>, 'LONG': <TokenType.BIGINT: 'BIGINT'>, 'BIGINT': <TokenType.BIGINT: 'BIGINT'>, 'INT8': <TokenType.BIGINT: 'BIGINT'>, 'DEC': <TokenType.DECIMAL: 'DECIMAL'>, 'DECIMAL': <TokenType.DECIMAL: 'DECIMAL'>, 'BIGDECIMAL': <TokenType.BIGDECIMAL: 'BIGDECIMAL'>, 'BIGNUMERIC': <TokenType.BIGDECIMAL: 'BIGDECIMAL'>, 'MAP': <TokenType.MAP: 'MAP'>, 'NULLABLE': <TokenType.NULLABLE: 'NULLABLE'>, 'NUMBER': <TokenType.DECIMAL: 'DECIMAL'>, 'NUMERIC': <TokenType.DECIMAL: 'DECIMAL'>, 'FIXED': <TokenType.DECIMAL: 'DECIMAL'>, 'REAL': <TokenType.FLOAT: 'FLOAT'>, 'FLOAT': <TokenType.FLOAT: 'FLOAT'>, 'FLOAT4': <TokenType.FLOAT: 'FLOAT'>, 'FLOAT8': <TokenType.DOUBLE: 'DOUBLE'>, 'DOUBLE': <TokenType.DOUBLE: 'DOUBLE'>, 'DOUBLE PRECISION': <TokenType.DOUBLE: 'DOUBLE'>, 'JSON': <TokenType.JSON: 'JSON'>, 'CHAR': <TokenType.CHAR: 'CHAR'>, 'CHARACTER': <TokenType.CHAR: 'CHAR'>, 'NCHAR': <TokenType.NCHAR: 'NCHAR'>, 'VARCHAR': <TokenType.VARCHAR: 'VARCHAR'>, 'VARCHAR2': <TokenType.VARCHAR: 'VARCHAR'>, 'NVARCHAR': <TokenType.NVARCHAR: 'NVARCHAR'>, 'NVARCHAR2': <TokenType.NVARCHAR: 'NVARCHAR'>, 'STR': <TokenType.TEXT: 'TEXT'>, 'STRING': <TokenType.TEXT: 'TEXT'>, 'TEXT': <TokenType.TEXT: 'TEXT'>, 'CLOB': <TokenType.TEXT: 'TEXT'>, 'LONGVARCHAR': <TokenType.TEXT: 'TEXT'>, 'BINARY': <TokenType.BINARY: 'BINARY'>, 'BLOB': <TokenType.VARBINARY: 'VARBINARY'>, 'BYTEA': <TokenType.VARBINARY: 'VARBINARY'>, 'VARBINARY': <TokenType.VARBINARY: 'VARBINARY'>, 'TIME': <TokenType.TIME: 'TIME'>, 'TIMESTAMP': <TokenType.TIMESTAMPTZ: 'TIMESTAMPTZ'>, 'TIMESTAMPTZ': <TokenType.TIMESTAMPTZ: 'TIMESTAMPTZ'>, 'TIMESTAMPLTZ': <TokenType.TIMESTAMPLTZ: 'TIMESTAMPLTZ'>, 'DATE': <TokenType.DATE: 'DATE'>, 'DATETIME': <TokenType.DATETIME: 'DATETIME'>, 'INT4RANGE': <TokenType.INT4RANGE: 'INT4RANGE'>, 'INT4MULTIRANGE': <TokenType.INT4MULTIRANGE: 'INT4MULTIRANGE'>, 'INT8RANGE': <TokenType.INT8RANGE: 'INT8RANGE'>, 'INT8MULTIRANGE': <TokenType.INT8MULTIRANGE: 'INT8MULTIRANGE'>, 'NUMRANGE': <TokenType.NUMRANGE: 'NUMRANGE'>, 'NUMMULTIRANGE': <TokenType.NUMMULTIRANGE: 'NUMMULTIRANGE'>, 'TSRANGE': <TokenType.TSRANGE: 'TSRANGE'>, 'TSMULTIRANGE': <TokenType.TSMULTIRANGE: 'TSMULTIRANGE'>, 'TSTZRANGE': <TokenType.TSTZRANGE: 'TSTZRANGE'>, 'TSTZMULTIRANGE': <TokenType.TSTZMULTIRANGE: 'TSTZMULTIRANGE'>, 'DATERANGE': <TokenType.DATERANGE: 'DATERANGE'>, 'DATEMULTIRANGE': <TokenType.DATEMULTIRANGE: 'DATEMULTIRANGE'>, 'UNIQUE': <TokenType.UNIQUE: 'UNIQUE'>, 'STRUCT': <TokenType.STRUCT: 'STRUCT'>, 'VARIANT': <TokenType.VARIANT: 'VARIANT'>, 'ALTER': <TokenType.ALTER: 'ALTER'>, 'ANALYZE': <TokenType.COMMAND: 'COMMAND'>, 'CALL': <TokenType.COMMAND: 'COMMAND'>, 'COMMENT': <TokenType.COMMENT: 'COMMENT'>, 'COPY': <TokenType.COMMAND: 'COMMAND'>, 'EXPLAIN': <TokenType.COMMAND: 'COMMAND'>, 'GRANT': <TokenType.COMMAND: 'COMMAND'>, 'OPTIMIZE': <TokenType.COMMAND: 'COMMAND'>, 'PREPARE': <TokenType.COMMAND: 'COMMAND'>, 'TRUNCATE': <TokenType.COMMAND: 'COMMAND'>, 'VACUUM': <TokenType.COMMAND: 'COMMAND'>, 'USER-DEFINED': <TokenType.USERDEFINED: 'USERDEFINED'>, 'ANY TYPE': <TokenType.VARIANT: 'VARIANT'>, 'BEGIN TRANSACTION': <TokenType.BEGIN: 'BEGIN'>, 'CURRENT_DATETIME': <TokenType.CURRENT_DATETIME: 'CURRENT_DATETIME'>, 'BYTES': <TokenType.BINARY: 'BINARY'>, 'DECLARE': <TokenType.COMMAND: 'COMMAND'>, 'FLOAT64': <TokenType.DOUBLE: 'DOUBLE'>, 'INT64': <TokenType.BIGINT: 'BIGINT'>, 'RECORD': <TokenType.STRUCT: 'STRUCT'>, 'NOT DETERMINISTIC': <TokenType.VOLATILE: 'VOLATILE'>, 'UNKNOWN': <TokenType.NULL: 'NULL'>}

Inherited Members

sqlglot.tokens.Tokenizer: SINGLE_TOKENS; BIT_STRINGS; IDENTIFIER_ESCAPES; VAR_SINGLE_TOKENS; IDENTIFIERS_CAN_START_WITH_DIGIT; WHITE_SPACE; COMMANDS; COMMAND_PREFIX_TOKENS; NUMERIC_LITERALS; ENCODE; reset; tokenize; peek; size; sql; tokens

sqlglot.dialects.bigquery

Inherited Members

Inherited Members

Arguments:

Inherited Members

Arguments:

Arguments:

Returns:

Inherited Members