Edit on GitHub

sqlglot.parser

View Source

   1from __future__ import annotations
   2
   3import logging
   4import typing as t
   5from collections import defaultdict
   6
   7from sqlglot import exp
   8from sqlglot.errors import ErrorLevel, ParseError, concat_messages, merge_errors
   9from sqlglot.helper import apply_index_offset, ensure_list, seq_get
  10from sqlglot.time import format_time
  11from sqlglot.tokens import Token, Tokenizer, TokenType
  12from sqlglot.trie import TrieResult, in_trie, new_trie
  13
  14if t.TYPE_CHECKING:
  15    from sqlglot._typing import E
  16
  17logger = logging.getLogger("sqlglot")
  18
  19
  20def parse_var_map(args: t.List) -> exp.StarMap | exp.VarMap:
  21    if len(args) == 1 and args[0].is_star:
  22        return exp.StarMap(this=args[0])
  23
  24    keys = []
  25    values = []
  26    for i in range(0, len(args), 2):
  27        keys.append(args[i])
  28        values.append(args[i + 1])
  29
  30    return exp.VarMap(
  31        keys=exp.Array(expressions=keys),
  32        values=exp.Array(expressions=values),
  33    )
  34
  35
  36def parse_like(args: t.List) -> exp.Escape | exp.Like:
  37    like = exp.Like(this=seq_get(args, 1), expression=seq_get(args, 0))
  38    return exp.Escape(this=like, expression=seq_get(args, 2)) if len(args) > 2 else like
  39
  40
  41def binary_range_parser(
  42    expr_type: t.Type[exp.Expression],
  43) -> t.Callable[[Parser, t.Optional[exp.Expression]], t.Optional[exp.Expression]]:
  44    return lambda self, this: self._parse_escape(
  45        self.expression(expr_type, this=this, expression=self._parse_bitwise())
  46    )
  47
  48
  49class _Parser(type):
  50    def __new__(cls, clsname, bases, attrs):
  51        klass = super().__new__(cls, clsname, bases, attrs)
  52
  53        klass.SHOW_TRIE = new_trie(key.split(" ") for key in klass.SHOW_PARSERS)
  54        klass.SET_TRIE = new_trie(key.split(" ") for key in klass.SET_PARSERS)
  55
  56        return klass
  57
  58
  59class Parser(metaclass=_Parser):
  60    """
  61    Parser consumes a list of tokens produced by the Tokenizer and produces a parsed syntax tree.
  62
  63    Args:
  64        error_level: The desired error level.
  65            Default: ErrorLevel.IMMEDIATE
  66        error_message_context: Determines the amount of context to capture from a
  67            query string when displaying the error message (in number of characters).
  68            Default: 100
  69        max_errors: Maximum number of error messages to include in a raised ParseError.
  70            This is only relevant if error_level is ErrorLevel.RAISE.
  71            Default: 3
  72    """
  73
  74    FUNCTIONS: t.Dict[str, t.Callable] = {
  75        **{name: f.from_arg_list for f in exp.ALL_FUNCTIONS for name in f.sql_names()},
  76        "DATE_TO_DATE_STR": lambda args: exp.Cast(
  77            this=seq_get(args, 0),
  78            to=exp.DataType(this=exp.DataType.Type.TEXT),
  79        ),
  80        "GLOB": lambda args: exp.Glob(this=seq_get(args, 1), expression=seq_get(args, 0)),
  81        "LIKE": parse_like,
  82        "TIME_TO_TIME_STR": lambda args: exp.Cast(
  83            this=seq_get(args, 0),
  84            to=exp.DataType(this=exp.DataType.Type.TEXT),
  85        ),
  86        "TS_OR_DS_TO_DATE_STR": lambda args: exp.Substring(
  87            this=exp.Cast(
  88                this=seq_get(args, 0),
  89                to=exp.DataType(this=exp.DataType.Type.TEXT),
  90            ),
  91            start=exp.Literal.number(1),
  92            length=exp.Literal.number(10),
  93        ),
  94        "VAR_MAP": parse_var_map,
  95    }
  96
  97    NO_PAREN_FUNCTIONS = {
  98        TokenType.CURRENT_DATE: exp.CurrentDate,
  99        TokenType.CURRENT_DATETIME: exp.CurrentDate,
 100        TokenType.CURRENT_TIME: exp.CurrentTime,
 101        TokenType.CURRENT_TIMESTAMP: exp.CurrentTimestamp,
 102        TokenType.CURRENT_USER: exp.CurrentUser,
 103    }
 104
 105    STRUCT_TYPE_TOKENS = {
 106        TokenType.NESTED,
 107        TokenType.STRUCT,
 108    }
 109
 110    NESTED_TYPE_TOKENS = {
 111        TokenType.ARRAY,
 112        TokenType.LOWCARDINALITY,
 113        TokenType.MAP,
 114        TokenType.NULLABLE,
 115        *STRUCT_TYPE_TOKENS,
 116    }
 117
 118    ENUM_TYPE_TOKENS = {
 119        TokenType.ENUM,
 120        TokenType.ENUM8,
 121        TokenType.ENUM16,
 122    }
 123
 124    TYPE_TOKENS = {
 125        TokenType.BIT,
 126        TokenType.BOOLEAN,
 127        TokenType.TINYINT,
 128        TokenType.UTINYINT,
 129        TokenType.SMALLINT,
 130        TokenType.USMALLINT,
 131        TokenType.INT,
 132        TokenType.UINT,
 133        TokenType.BIGINT,
 134        TokenType.UBIGINT,
 135        TokenType.INT128,
 136        TokenType.UINT128,
 137        TokenType.INT256,
 138        TokenType.UINT256,
 139        TokenType.MEDIUMINT,
 140        TokenType.FIXEDSTRING,
 141        TokenType.FLOAT,
 142        TokenType.DOUBLE,
 143        TokenType.CHAR,
 144        TokenType.NCHAR,
 145        TokenType.VARCHAR,
 146        TokenType.NVARCHAR,
 147        TokenType.TEXT,
 148        TokenType.MEDIUMTEXT,
 149        TokenType.LONGTEXT,
 150        TokenType.MEDIUMBLOB,
 151        TokenType.LONGBLOB,
 152        TokenType.BINARY,
 153        TokenType.VARBINARY,
 154        TokenType.JSON,
 155        TokenType.JSONB,
 156        TokenType.INTERVAL,
 157        TokenType.TIME,
 158        TokenType.TIMETZ,
 159        TokenType.TIMESTAMP,
 160        TokenType.TIMESTAMPTZ,
 161        TokenType.TIMESTAMPLTZ,
 162        TokenType.DATETIME,
 163        TokenType.DATETIME64,
 164        TokenType.DATE,
 165        TokenType.INT4RANGE,
 166        TokenType.INT4MULTIRANGE,
 167        TokenType.INT8RANGE,
 168        TokenType.INT8MULTIRANGE,
 169        TokenType.NUMRANGE,
 170        TokenType.NUMMULTIRANGE,
 171        TokenType.TSRANGE,
 172        TokenType.TSMULTIRANGE,
 173        TokenType.TSTZRANGE,
 174        TokenType.TSTZMULTIRANGE,
 175        TokenType.DATERANGE,
 176        TokenType.DATEMULTIRANGE,
 177        TokenType.DECIMAL,
 178        TokenType.BIGDECIMAL,
 179        TokenType.UUID,
 180        TokenType.GEOGRAPHY,
 181        TokenType.GEOMETRY,
 182        TokenType.HLLSKETCH,
 183        TokenType.HSTORE,
 184        TokenType.PSEUDO_TYPE,
 185        TokenType.SUPER,
 186        TokenType.SERIAL,
 187        TokenType.SMALLSERIAL,
 188        TokenType.BIGSERIAL,
 189        TokenType.XML,
 190        TokenType.YEAR,
 191        TokenType.UNIQUEIDENTIFIER,
 192        TokenType.USERDEFINED,
 193        TokenType.MONEY,
 194        TokenType.SMALLMONEY,
 195        TokenType.ROWVERSION,
 196        TokenType.IMAGE,
 197        TokenType.VARIANT,
 198        TokenType.OBJECT,
 199        TokenType.INET,
 200        TokenType.IPADDRESS,
 201        TokenType.IPPREFIX,
 202        TokenType.UNKNOWN,
 203        TokenType.NULL,
 204        *ENUM_TYPE_TOKENS,
 205        *NESTED_TYPE_TOKENS,
 206    }
 207
 208    SUBQUERY_PREDICATES = {
 209        TokenType.ANY: exp.Any,
 210        TokenType.ALL: exp.All,
 211        TokenType.EXISTS: exp.Exists,
 212        TokenType.SOME: exp.Any,
 213    }
 214
 215    RESERVED_KEYWORDS = {
 216        *Tokenizer.SINGLE_TOKENS.values(),
 217        TokenType.SELECT,
 218    }
 219
 220    DB_CREATABLES = {
 221        TokenType.DATABASE,
 222        TokenType.SCHEMA,
 223        TokenType.TABLE,
 224        TokenType.VIEW,
 225        TokenType.DICTIONARY,
 226    }
 227
 228    CREATABLES = {
 229        TokenType.COLUMN,
 230        TokenType.FUNCTION,
 231        TokenType.INDEX,
 232        TokenType.PROCEDURE,
 233        *DB_CREATABLES,
 234    }
 235
 236    # Tokens that can represent identifiers
 237    ID_VAR_TOKENS = {
 238        TokenType.VAR,
 239        TokenType.ANTI,
 240        TokenType.APPLY,
 241        TokenType.ASC,
 242        TokenType.AUTO_INCREMENT,
 243        TokenType.BEGIN,
 244        TokenType.CACHE,
 245        TokenType.CASE,
 246        TokenType.COLLATE,
 247        TokenType.COMMAND,
 248        TokenType.COMMENT,
 249        TokenType.COMMIT,
 250        TokenType.CONSTRAINT,
 251        TokenType.DEFAULT,
 252        TokenType.DELETE,
 253        TokenType.DESC,
 254        TokenType.DESCRIBE,
 255        TokenType.DICTIONARY,
 256        TokenType.DIV,
 257        TokenType.END,
 258        TokenType.EXECUTE,
 259        TokenType.ESCAPE,
 260        TokenType.FALSE,
 261        TokenType.FIRST,
 262        TokenType.FILTER,
 263        TokenType.FORMAT,
 264        TokenType.FULL,
 265        TokenType.IS,
 266        TokenType.ISNULL,
 267        TokenType.INTERVAL,
 268        TokenType.KEEP,
 269        TokenType.LEFT,
 270        TokenType.LOAD,
 271        TokenType.MERGE,
 272        TokenType.NATURAL,
 273        TokenType.NEXT,
 274        TokenType.OFFSET,
 275        TokenType.ORDINALITY,
 276        TokenType.OVERWRITE,
 277        TokenType.PARTITION,
 278        TokenType.PERCENT,
 279        TokenType.PIVOT,
 280        TokenType.PRAGMA,
 281        TokenType.RANGE,
 282        TokenType.REFERENCES,
 283        TokenType.RIGHT,
 284        TokenType.ROW,
 285        TokenType.ROWS,
 286        TokenType.SEMI,
 287        TokenType.SET,
 288        TokenType.SETTINGS,
 289        TokenType.SHOW,
 290        TokenType.TEMPORARY,
 291        TokenType.TOP,
 292        TokenType.TRUE,
 293        TokenType.UNIQUE,
 294        TokenType.UNPIVOT,
 295        TokenType.UPDATE,
 296        TokenType.VOLATILE,
 297        TokenType.WINDOW,
 298        *CREATABLES,
 299        *SUBQUERY_PREDICATES,
 300        *TYPE_TOKENS,
 301        *NO_PAREN_FUNCTIONS,
 302    }
 303
 304    INTERVAL_VARS = ID_VAR_TOKENS - {TokenType.END}
 305
 306    TABLE_ALIAS_TOKENS = ID_VAR_TOKENS - {
 307        TokenType.APPLY,
 308        TokenType.ASOF,
 309        TokenType.FULL,
 310        TokenType.LEFT,
 311        TokenType.LOCK,
 312        TokenType.NATURAL,
 313        TokenType.OFFSET,
 314        TokenType.RIGHT,
 315        TokenType.WINDOW,
 316    }
 317
 318    COMMENT_TABLE_ALIAS_TOKENS = TABLE_ALIAS_TOKENS - {TokenType.IS}
 319
 320    UPDATE_ALIAS_TOKENS = TABLE_ALIAS_TOKENS - {TokenType.SET}
 321
 322    TRIM_TYPES = {"LEADING", "TRAILING", "BOTH"}
 323
 324    FUNC_TOKENS = {
 325        TokenType.COMMAND,
 326        TokenType.CURRENT_DATE,
 327        TokenType.CURRENT_DATETIME,
 328        TokenType.CURRENT_TIMESTAMP,
 329        TokenType.CURRENT_TIME,
 330        TokenType.CURRENT_USER,
 331        TokenType.FILTER,
 332        TokenType.FIRST,
 333        TokenType.FORMAT,
 334        TokenType.GLOB,
 335        TokenType.IDENTIFIER,
 336        TokenType.INDEX,
 337        TokenType.ISNULL,
 338        TokenType.ILIKE,
 339        TokenType.INSERT,
 340        TokenType.LIKE,
 341        TokenType.MERGE,
 342        TokenType.OFFSET,
 343        TokenType.PRIMARY_KEY,
 344        TokenType.RANGE,
 345        TokenType.REPLACE,
 346        TokenType.RLIKE,
 347        TokenType.ROW,
 348        TokenType.UNNEST,
 349        TokenType.VAR,
 350        TokenType.LEFT,
 351        TokenType.RIGHT,
 352        TokenType.DATE,
 353        TokenType.DATETIME,
 354        TokenType.TABLE,
 355        TokenType.TIMESTAMP,
 356        TokenType.TIMESTAMPTZ,
 357        TokenType.WINDOW,
 358        TokenType.XOR,
 359        *TYPE_TOKENS,
 360        *SUBQUERY_PREDICATES,
 361    }
 362
 363    CONJUNCTION = {
 364        TokenType.AND: exp.And,
 365        TokenType.OR: exp.Or,
 366    }
 367
 368    EQUALITY = {
 369        TokenType.EQ: exp.EQ,
 370        TokenType.NEQ: exp.NEQ,
 371        TokenType.NULLSAFE_EQ: exp.NullSafeEQ,
 372    }
 373
 374    COMPARISON = {
 375        TokenType.GT: exp.GT,
 376        TokenType.GTE: exp.GTE,
 377        TokenType.LT: exp.LT,
 378        TokenType.LTE: exp.LTE,
 379    }
 380
 381    BITWISE = {
 382        TokenType.AMP: exp.BitwiseAnd,
 383        TokenType.CARET: exp.BitwiseXor,
 384        TokenType.PIPE: exp.BitwiseOr,
 385        TokenType.DPIPE: exp.DPipe,
 386    }
 387
 388    TERM = {
 389        TokenType.DASH: exp.Sub,
 390        TokenType.PLUS: exp.Add,
 391        TokenType.MOD: exp.Mod,
 392        TokenType.COLLATE: exp.Collate,
 393    }
 394
 395    FACTOR = {
 396        TokenType.DIV: exp.IntDiv,
 397        TokenType.LR_ARROW: exp.Distance,
 398        TokenType.SLASH: exp.Div,
 399        TokenType.STAR: exp.Mul,
 400    }
 401
 402    TIMES = {
 403        TokenType.TIME,
 404        TokenType.TIMETZ,
 405    }
 406
 407    TIMESTAMPS = {
 408        TokenType.TIMESTAMP,
 409        TokenType.TIMESTAMPTZ,
 410        TokenType.TIMESTAMPLTZ,
 411        *TIMES,
 412    }
 413
 414    SET_OPERATIONS = {
 415        TokenType.UNION,
 416        TokenType.INTERSECT,
 417        TokenType.EXCEPT,
 418    }
 419
 420    JOIN_METHODS = {
 421        TokenType.NATURAL,
 422        TokenType.ASOF,
 423    }
 424
 425    JOIN_SIDES = {
 426        TokenType.LEFT,
 427        TokenType.RIGHT,
 428        TokenType.FULL,
 429    }
 430
 431    JOIN_KINDS = {
 432        TokenType.INNER,
 433        TokenType.OUTER,
 434        TokenType.CROSS,
 435        TokenType.SEMI,
 436        TokenType.ANTI,
 437    }
 438
 439    JOIN_HINTS: t.Set[str] = set()
 440
 441    LAMBDAS = {
 442        TokenType.ARROW: lambda self, expressions: self.expression(
 443            exp.Lambda,
 444            this=self._replace_lambda(
 445                self._parse_conjunction(),
 446                {node.name for node in expressions},
 447            ),
 448            expressions=expressions,
 449        ),
 450        TokenType.FARROW: lambda self, expressions: self.expression(
 451            exp.Kwarg,
 452            this=exp.var(expressions[0].name),
 453            expression=self._parse_conjunction(),
 454        ),
 455    }
 456
 457    COLUMN_OPERATORS = {
 458        TokenType.DOT: None,
 459        TokenType.DCOLON: lambda self, this, to: self.expression(
 460            exp.Cast if self.STRICT_CAST else exp.TryCast,
 461            this=this,
 462            to=to,
 463        ),
 464        TokenType.ARROW: lambda self, this, path: self.expression(
 465            exp.JSONExtract,
 466            this=this,
 467            expression=path,
 468        ),
 469        TokenType.DARROW: lambda self, this, path: self.expression(
 470            exp.JSONExtractScalar,
 471            this=this,
 472            expression=path,
 473        ),
 474        TokenType.HASH_ARROW: lambda self, this, path: self.expression(
 475            exp.JSONBExtract,
 476            this=this,
 477            expression=path,
 478        ),
 479        TokenType.DHASH_ARROW: lambda self, this, path: self.expression(
 480            exp.JSONBExtractScalar,
 481            this=this,
 482            expression=path,
 483        ),
 484        TokenType.PLACEHOLDER: lambda self, this, key: self.expression(
 485            exp.JSONBContains,
 486            this=this,
 487            expression=key,
 488        ),
 489    }
 490
 491    EXPRESSION_PARSERS = {
 492        exp.Cluster: lambda self: self._parse_sort(exp.Cluster, TokenType.CLUSTER_BY),
 493        exp.Column: lambda self: self._parse_column(),
 494        exp.Condition: lambda self: self._parse_conjunction(),
 495        exp.DataType: lambda self: self._parse_types(allow_identifiers=False),
 496        exp.Expression: lambda self: self._parse_statement(),
 497        exp.From: lambda self: self._parse_from(),
 498        exp.Group: lambda self: self._parse_group(),
 499        exp.Having: lambda self: self._parse_having(),
 500        exp.Identifier: lambda self: self._parse_id_var(),
 501        exp.Join: lambda self: self._parse_join(),
 502        exp.Lambda: lambda self: self._parse_lambda(),
 503        exp.Lateral: lambda self: self._parse_lateral(),
 504        exp.Limit: lambda self: self._parse_limit(),
 505        exp.Offset: lambda self: self._parse_offset(),
 506        exp.Order: lambda self: self._parse_order(),
 507        exp.Ordered: lambda self: self._parse_ordered(),
 508        exp.Properties: lambda self: self._parse_properties(),
 509        exp.Qualify: lambda self: self._parse_qualify(),
 510        exp.Returning: lambda self: self._parse_returning(),
 511        exp.Sort: lambda self: self._parse_sort(exp.Sort, TokenType.SORT_BY),
 512        exp.Table: lambda self: self._parse_table_parts(),
 513        exp.TableAlias: lambda self: self._parse_table_alias(),
 514        exp.Where: lambda self: self._parse_where(),
 515        exp.Window: lambda self: self._parse_named_window(),
 516        exp.With: lambda self: self._parse_with(),
 517        "JOIN_TYPE": lambda self: self._parse_join_parts(),
 518    }
 519
 520    STATEMENT_PARSERS = {
 521        TokenType.ALTER: lambda self: self._parse_alter(),
 522        TokenType.BEGIN: lambda self: self._parse_transaction(),
 523        TokenType.CACHE: lambda self: self._parse_cache(),
 524        TokenType.COMMIT: lambda self: self._parse_commit_or_rollback(),
 525        TokenType.COMMENT: lambda self: self._parse_comment(),
 526        TokenType.CREATE: lambda self: self._parse_create(),
 527        TokenType.DELETE: lambda self: self._parse_delete(),
 528        TokenType.DESC: lambda self: self._parse_describe(),
 529        TokenType.DESCRIBE: lambda self: self._parse_describe(),
 530        TokenType.DROP: lambda self: self._parse_drop(),
 531        TokenType.INSERT: lambda self: self._parse_insert(),
 532        TokenType.LOAD: lambda self: self._parse_load(),
 533        TokenType.MERGE: lambda self: self._parse_merge(),
 534        TokenType.PIVOT: lambda self: self._parse_simplified_pivot(),
 535        TokenType.PRAGMA: lambda self: self.expression(exp.Pragma, this=self._parse_expression()),
 536        TokenType.ROLLBACK: lambda self: self._parse_commit_or_rollback(),
 537        TokenType.SET: lambda self: self._parse_set(),
 538        TokenType.UNCACHE: lambda self: self._parse_uncache(),
 539        TokenType.UPDATE: lambda self: self._parse_update(),
 540        TokenType.USE: lambda self: self.expression(
 541            exp.Use,
 542            kind=self._match_texts(("ROLE", "WAREHOUSE", "DATABASE", "SCHEMA"))
 543            and exp.var(self._prev.text),
 544            this=self._parse_table(schema=False),
 545        ),
 546    }
 547
 548    UNARY_PARSERS = {
 549        TokenType.PLUS: lambda self: self._parse_unary(),  # Unary + is handled as a no-op
 550        TokenType.NOT: lambda self: self.expression(exp.Not, this=self._parse_equality()),
 551        TokenType.TILDA: lambda self: self.expression(exp.BitwiseNot, this=self._parse_unary()),
 552        TokenType.DASH: lambda self: self.expression(exp.Neg, this=self._parse_unary()),
 553    }
 554
 555    PRIMARY_PARSERS = {
 556        TokenType.STRING: lambda self, token: self.expression(
 557            exp.Literal, this=token.text, is_string=True
 558        ),
 559        TokenType.NUMBER: lambda self, token: self.expression(
 560            exp.Literal, this=token.text, is_string=False
 561        ),
 562        TokenType.STAR: lambda self, _: self.expression(
 563            exp.Star, **{"except": self._parse_except(), "replace": self._parse_replace()}
 564        ),
 565        TokenType.NULL: lambda self, _: self.expression(exp.Null),
 566        TokenType.TRUE: lambda self, _: self.expression(exp.Boolean, this=True),
 567        TokenType.FALSE: lambda self, _: self.expression(exp.Boolean, this=False),
 568        TokenType.BIT_STRING: lambda self, token: self.expression(exp.BitString, this=token.text),
 569        TokenType.HEX_STRING: lambda self, token: self.expression(exp.HexString, this=token.text),
 570        TokenType.BYTE_STRING: lambda self, token: self.expression(exp.ByteString, this=token.text),
 571        TokenType.INTRODUCER: lambda self, token: self._parse_introducer(token),
 572        TokenType.NATIONAL_STRING: lambda self, token: self.expression(
 573            exp.National, this=token.text
 574        ),
 575        TokenType.RAW_STRING: lambda self, token: self.expression(exp.RawString, this=token.text),
 576        TokenType.SESSION_PARAMETER: lambda self, _: self._parse_session_parameter(),
 577    }
 578
 579    PLACEHOLDER_PARSERS = {
 580        TokenType.PLACEHOLDER: lambda self: self.expression(exp.Placeholder),
 581        TokenType.PARAMETER: lambda self: self._parse_parameter(),
 582        TokenType.COLON: lambda self: self.expression(exp.Placeholder, this=self._prev.text)
 583        if self._match(TokenType.NUMBER) or self._match_set(self.ID_VAR_TOKENS)
 584        else None,
 585    }
 586
 587    RANGE_PARSERS = {
 588        TokenType.BETWEEN: lambda self, this: self._parse_between(this),
 589        TokenType.GLOB: binary_range_parser(exp.Glob),
 590        TokenType.ILIKE: binary_range_parser(exp.ILike),
 591        TokenType.IN: lambda self, this: self._parse_in(this),
 592        TokenType.IRLIKE: binary_range_parser(exp.RegexpILike),
 593        TokenType.IS: lambda self, this: self._parse_is(this),
 594        TokenType.LIKE: binary_range_parser(exp.Like),
 595        TokenType.OVERLAPS: binary_range_parser(exp.Overlaps),
 596        TokenType.RLIKE: binary_range_parser(exp.RegexpLike),
 597        TokenType.SIMILAR_TO: binary_range_parser(exp.SimilarTo),
 598        TokenType.FOR: lambda self, this: self._parse_comprehension(this),
 599    }
 600
 601    PROPERTY_PARSERS: t.Dict[str, t.Callable] = {
 602        "ALGORITHM": lambda self: self._parse_property_assignment(exp.AlgorithmProperty),
 603        "AUTO_INCREMENT": lambda self: self._parse_property_assignment(exp.AutoIncrementProperty),
 604        "BLOCKCOMPRESSION": lambda self: self._parse_blockcompression(),
 605        "CHARACTER SET": lambda self: self._parse_character_set(),
 606        "CHECKSUM": lambda self: self._parse_checksum(),
 607        "CLUSTER BY": lambda self: self._parse_cluster(),
 608        "CLUSTERED": lambda self: self._parse_clustered_by(),
 609        "COLLATE": lambda self: self._parse_property_assignment(exp.CollateProperty),
 610        "COMMENT": lambda self: self._parse_property_assignment(exp.SchemaCommentProperty),
 611        "COPY": lambda self: self._parse_copy_property(),
 612        "DATABLOCKSIZE": lambda self, **kwargs: self._parse_datablocksize(**kwargs),
 613        "DEFINER": lambda self: self._parse_definer(),
 614        "DETERMINISTIC": lambda self: self.expression(
 615            exp.StabilityProperty, this=exp.Literal.string("IMMUTABLE")
 616        ),
 617        "DISTKEY": lambda self: self._parse_distkey(),
 618        "DISTSTYLE": lambda self: self._parse_property_assignment(exp.DistStyleProperty),
 619        "ENGINE": lambda self: self._parse_property_assignment(exp.EngineProperty),
 620        "EXECUTE": lambda self: self._parse_property_assignment(exp.ExecuteAsProperty),
 621        "EXTERNAL": lambda self: self.expression(exp.ExternalProperty),
 622        "FALLBACK": lambda self, **kwargs: self._parse_fallback(**kwargs),
 623        "FORMAT": lambda self: self._parse_property_assignment(exp.FileFormatProperty),
 624        "FREESPACE": lambda self: self._parse_freespace(),
 625        "HEAP": lambda self: self.expression(exp.HeapProperty),
 626        "IMMUTABLE": lambda self: self.expression(
 627            exp.StabilityProperty, this=exp.Literal.string("IMMUTABLE")
 628        ),
 629        "JOURNAL": lambda self, **kwargs: self._parse_journal(**kwargs),
 630        "LANGUAGE": lambda self: self._parse_property_assignment(exp.LanguageProperty),
 631        "LAYOUT": lambda self: self._parse_dict_property(this="LAYOUT"),
 632        "LIFETIME": lambda self: self._parse_dict_range(this="LIFETIME"),
 633        "LIKE": lambda self: self._parse_create_like(),
 634        "LOCATION": lambda self: self._parse_property_assignment(exp.LocationProperty),
 635        "LOCK": lambda self: self._parse_locking(),
 636        "LOCKING": lambda self: self._parse_locking(),
 637        "LOG": lambda self, **kwargs: self._parse_log(**kwargs),
 638        "MATERIALIZED": lambda self: self.expression(exp.MaterializedProperty),
 639        "MERGEBLOCKRATIO": lambda self, **kwargs: self._parse_mergeblockratio(**kwargs),
 640        "MULTISET": lambda self: self.expression(exp.SetProperty, multi=True),
 641        "NO": lambda self: self._parse_no_property(),
 642        "ON": lambda self: self._parse_on_property(),
 643        "ORDER BY": lambda self: self._parse_order(skip_order_token=True),
 644        "PARTITION BY": lambda self: self._parse_partitioned_by(),
 645        "PARTITIONED BY": lambda self: self._parse_partitioned_by(),
 646        "PARTITIONED_BY": lambda self: self._parse_partitioned_by(),
 647        "PRIMARY KEY": lambda self: self._parse_primary_key(in_props=True),
 648        "RANGE": lambda self: self._parse_dict_range(this="RANGE"),
 649        "RETURNS": lambda self: self._parse_returns(),
 650        "ROW": lambda self: self._parse_row(),
 651        "ROW_FORMAT": lambda self: self._parse_property_assignment(exp.RowFormatProperty),
 652        "SET": lambda self: self.expression(exp.SetProperty, multi=False),
 653        "SETTINGS": lambda self: self.expression(
 654            exp.SettingsProperty, expressions=self._parse_csv(self._parse_set_item)
 655        ),
 656        "SORTKEY": lambda self: self._parse_sortkey(),
 657        "SOURCE": lambda self: self._parse_dict_property(this="SOURCE"),
 658        "STABLE": lambda self: self.expression(
 659            exp.StabilityProperty, this=exp.Literal.string("STABLE")
 660        ),
 661        "STORED": lambda self: self._parse_stored(),
 662        "TBLPROPERTIES": lambda self: self._parse_wrapped_csv(self._parse_property),
 663        "TEMP": lambda self: self.expression(exp.TemporaryProperty),
 664        "TEMPORARY": lambda self: self.expression(exp.TemporaryProperty),
 665        "TO": lambda self: self._parse_to_table(),
 666        "TRANSIENT": lambda self: self.expression(exp.TransientProperty),
 667        "TTL": lambda self: self._parse_ttl(),
 668        "USING": lambda self: self._parse_property_assignment(exp.FileFormatProperty),
 669        "VOLATILE": lambda self: self._parse_volatile_property(),
 670        "WITH": lambda self: self._parse_with_property(),
 671    }
 672
 673    CONSTRAINT_PARSERS = {
 674        "AUTOINCREMENT": lambda self: self._parse_auto_increment(),
 675        "AUTO_INCREMENT": lambda self: self._parse_auto_increment(),
 676        "CASESPECIFIC": lambda self: self.expression(exp.CaseSpecificColumnConstraint, not_=False),
 677        "CHARACTER SET": lambda self: self.expression(
 678            exp.CharacterSetColumnConstraint, this=self._parse_var_or_string()
 679        ),
 680        "CHECK": lambda self: self.expression(
 681            exp.CheckColumnConstraint, this=self._parse_wrapped(self._parse_conjunction)
 682        ),
 683        "COLLATE": lambda self: self.expression(
 684            exp.CollateColumnConstraint, this=self._parse_var()
 685        ),
 686        "COMMENT": lambda self: self.expression(
 687            exp.CommentColumnConstraint, this=self._parse_string()
 688        ),
 689        "COMPRESS": lambda self: self._parse_compress(),
 690        "CLUSTERED": lambda self: self.expression(
 691            exp.ClusteredColumnConstraint, this=self._parse_wrapped_csv(self._parse_ordered)
 692        ),
 693        "NONCLUSTERED": lambda self: self.expression(
 694            exp.NonClusteredColumnConstraint, this=self._parse_wrapped_csv(self._parse_ordered)
 695        ),
 696        "DEFAULT": lambda self: self.expression(
 697            exp.DefaultColumnConstraint, this=self._parse_bitwise()
 698        ),
 699        "ENCODE": lambda self: self.expression(exp.EncodeColumnConstraint, this=self._parse_var()),
 700        "FOREIGN KEY": lambda self: self._parse_foreign_key(),
 701        "FORMAT": lambda self: self.expression(
 702            exp.DateFormatColumnConstraint, this=self._parse_var_or_string()
 703        ),
 704        "GENERATED": lambda self: self._parse_generated_as_identity(),
 705        "IDENTITY": lambda self: self._parse_auto_increment(),
 706        "INLINE": lambda self: self._parse_inline(),
 707        "LIKE": lambda self: self._parse_create_like(),
 708        "NOT": lambda self: self._parse_not_constraint(),
 709        "NULL": lambda self: self.expression(exp.NotNullColumnConstraint, allow_null=True),
 710        "ON": lambda self: (
 711            self._match(TokenType.UPDATE)
 712            and self.expression(exp.OnUpdateColumnConstraint, this=self._parse_function())
 713        )
 714        or self.expression(exp.OnProperty, this=self._parse_id_var()),
 715        "PATH": lambda self: self.expression(exp.PathColumnConstraint, this=self._parse_string()),
 716        "PRIMARY KEY": lambda self: self._parse_primary_key(),
 717        "REFERENCES": lambda self: self._parse_references(match=False),
 718        "TITLE": lambda self: self.expression(
 719            exp.TitleColumnConstraint, this=self._parse_var_or_string()
 720        ),
 721        "TTL": lambda self: self.expression(exp.MergeTreeTTL, expressions=[self._parse_bitwise()]),
 722        "UNIQUE": lambda self: self._parse_unique(),
 723        "UPPERCASE": lambda self: self.expression(exp.UppercaseColumnConstraint),
 724        "WITH": lambda self: self.expression(
 725            exp.Properties, expressions=self._parse_wrapped_csv(self._parse_property)
 726        ),
 727    }
 728
 729    ALTER_PARSERS = {
 730        "ADD": lambda self: self._parse_alter_table_add(),
 731        "ALTER": lambda self: self._parse_alter_table_alter(),
 732        "DELETE": lambda self: self.expression(exp.Delete, where=self._parse_where()),
 733        "DROP": lambda self: self._parse_alter_table_drop(),
 734        "RENAME": lambda self: self._parse_alter_table_rename(),
 735    }
 736
 737    SCHEMA_UNNAMED_CONSTRAINTS = {"CHECK", "FOREIGN KEY", "LIKE", "PRIMARY KEY", "UNIQUE"}
 738
 739    NO_PAREN_FUNCTION_PARSERS = {
 740        "ANY": lambda self: self.expression(exp.Any, this=self._parse_bitwise()),
 741        "CASE": lambda self: self._parse_case(),
 742        "IF": lambda self: self._parse_if(),
 743        "NEXT": lambda self: self._parse_next_value_for(),
 744    }
 745
 746    INVALID_FUNC_NAME_TOKENS = {
 747        TokenType.IDENTIFIER,
 748        TokenType.STRING,
 749    }
 750
 751    FUNCTIONS_WITH_ALIASED_ARGS = {"STRUCT"}
 752
 753    FUNCTION_PARSERS = {
 754        "ANY_VALUE": lambda self: self._parse_any_value(),
 755        "CAST": lambda self: self._parse_cast(self.STRICT_CAST),
 756        "CONCAT": lambda self: self._parse_concat(),
 757        "CONVERT": lambda self: self._parse_convert(self.STRICT_CAST),
 758        "DECODE": lambda self: self._parse_decode(),
 759        "EXTRACT": lambda self: self._parse_extract(),
 760        "JSON_OBJECT": lambda self: self._parse_json_object(),
 761        "LOG": lambda self: self._parse_logarithm(),
 762        "MATCH": lambda self: self._parse_match_against(),
 763        "OPENJSON": lambda self: self._parse_open_json(),
 764        "POSITION": lambda self: self._parse_position(),
 765        "SAFE_CAST": lambda self: self._parse_cast(False),
 766        "STRING_AGG": lambda self: self._parse_string_agg(),
 767        "SUBSTRING": lambda self: self._parse_substring(),
 768        "TRIM": lambda self: self._parse_trim(),
 769        "TRY_CAST": lambda self: self._parse_cast(False),
 770        "TRY_CONVERT": lambda self: self._parse_convert(False),
 771    }
 772
 773    QUERY_MODIFIER_PARSERS = {
 774        TokenType.MATCH_RECOGNIZE: lambda self: ("match", self._parse_match_recognize()),
 775        TokenType.WHERE: lambda self: ("where", self._parse_where()),
 776        TokenType.GROUP_BY: lambda self: ("group", self._parse_group()),
 777        TokenType.HAVING: lambda self: ("having", self._parse_having()),
 778        TokenType.QUALIFY: lambda self: ("qualify", self._parse_qualify()),
 779        TokenType.WINDOW: lambda self: ("windows", self._parse_window_clause()),
 780        TokenType.ORDER_BY: lambda self: ("order", self._parse_order()),
 781        TokenType.LIMIT: lambda self: ("limit", self._parse_limit()),
 782        TokenType.FETCH: lambda self: ("limit", self._parse_limit()),
 783        TokenType.OFFSET: lambda self: ("offset", self._parse_offset()),
 784        TokenType.FOR: lambda self: ("locks", self._parse_locks()),
 785        TokenType.LOCK: lambda self: ("locks", self._parse_locks()),
 786        TokenType.TABLE_SAMPLE: lambda self: ("sample", self._parse_table_sample(as_modifier=True)),
 787        TokenType.USING: lambda self: ("sample", self._parse_table_sample(as_modifier=True)),
 788        TokenType.CLUSTER_BY: lambda self: (
 789            "cluster",
 790            self._parse_sort(exp.Cluster, TokenType.CLUSTER_BY),
 791        ),
 792        TokenType.DISTRIBUTE_BY: lambda self: (
 793            "distribute",
 794            self._parse_sort(exp.Distribute, TokenType.DISTRIBUTE_BY),
 795        ),
 796        TokenType.SORT_BY: lambda self: ("sort", self._parse_sort(exp.Sort, TokenType.SORT_BY)),
 797        TokenType.CONNECT_BY: lambda self: ("connect", self._parse_connect(skip_start_token=True)),
 798        TokenType.START_WITH: lambda self: ("connect", self._parse_connect()),
 799    }
 800
 801    SET_PARSERS = {
 802        "GLOBAL": lambda self: self._parse_set_item_assignment("GLOBAL"),
 803        "LOCAL": lambda self: self._parse_set_item_assignment("LOCAL"),
 804        "SESSION": lambda self: self._parse_set_item_assignment("SESSION"),
 805        "TRANSACTION": lambda self: self._parse_set_transaction(),
 806    }
 807
 808    SHOW_PARSERS: t.Dict[str, t.Callable] = {}
 809
 810    TYPE_LITERAL_PARSERS: t.Dict[exp.DataType.Type, t.Callable] = {}
 811
 812    MODIFIABLES = (exp.Subquery, exp.Subqueryable, exp.Table)
 813
 814    DDL_SELECT_TOKENS = {TokenType.SELECT, TokenType.WITH, TokenType.L_PAREN}
 815
 816    PRE_VOLATILE_TOKENS = {TokenType.CREATE, TokenType.REPLACE, TokenType.UNIQUE}
 817
 818    TRANSACTION_KIND = {"DEFERRED", "IMMEDIATE", "EXCLUSIVE"}
 819    TRANSACTION_CHARACTERISTICS = {
 820        "ISOLATION LEVEL REPEATABLE READ",
 821        "ISOLATION LEVEL READ COMMITTED",
 822        "ISOLATION LEVEL READ UNCOMMITTED",
 823        "ISOLATION LEVEL SERIALIZABLE",
 824        "READ WRITE",
 825        "READ ONLY",
 826    }
 827
 828    INSERT_ALTERNATIVES = {"ABORT", "FAIL", "IGNORE", "REPLACE", "ROLLBACK"}
 829
 830    CLONE_KINDS = {"TIMESTAMP", "OFFSET", "STATEMENT"}
 831
 832    TABLE_INDEX_HINT_TOKENS = {TokenType.FORCE, TokenType.IGNORE, TokenType.USE}
 833
 834    WINDOW_ALIAS_TOKENS = ID_VAR_TOKENS - {TokenType.ROWS}
 835    WINDOW_BEFORE_PAREN_TOKENS = {TokenType.OVER}
 836    WINDOW_SIDES = {"FOLLOWING", "PRECEDING"}
 837
 838    ADD_CONSTRAINT_TOKENS = {TokenType.CONSTRAINT, TokenType.PRIMARY_KEY, TokenType.FOREIGN_KEY}
 839
 840    DISTINCT_TOKENS = {TokenType.DISTINCT}
 841
 842    STRICT_CAST = True
 843
 844    # A NULL arg in CONCAT yields NULL by default
 845    CONCAT_NULL_OUTPUTS_STRING = False
 846
 847    PREFIXED_PIVOT_COLUMNS = False
 848    IDENTIFY_PIVOT_STRINGS = False
 849
 850    LOG_BASE_FIRST = True
 851    LOG_DEFAULTS_TO_LN = False
 852
 853    SUPPORTS_USER_DEFINED_TYPES = True
 854
 855    # Whether or not ADD is present for each column added by ALTER TABLE
 856    ALTER_TABLE_ADD_COLUMN_KEYWORD = True
 857
 858    __slots__ = (
 859        "error_level",
 860        "error_message_context",
 861        "max_errors",
 862        "sql",
 863        "errors",
 864        "_tokens",
 865        "_index",
 866        "_curr",
 867        "_next",
 868        "_prev",
 869        "_prev_comments",
 870        "_tokenizer",
 871    )
 872
 873    # Autofilled
 874    TOKENIZER_CLASS: t.Type[Tokenizer] = Tokenizer
 875    INDEX_OFFSET: int = 0
 876    UNNEST_COLUMN_ONLY: bool = False
 877    ALIAS_POST_TABLESAMPLE: bool = False
 878    STRICT_STRING_CONCAT = False
 879    NORMALIZE_FUNCTIONS = "upper"
 880    NULL_ORDERING: str = "nulls_are_small"
 881    SHOW_TRIE: t.Dict = {}
 882    SET_TRIE: t.Dict = {}
 883    FORMAT_MAPPING: t.Dict[str, str] = {}
 884    FORMAT_TRIE: t.Dict = {}
 885    TIME_MAPPING: t.Dict[str, str] = {}
 886    TIME_TRIE: t.Dict = {}
 887
 888    def __init__(
 889        self,
 890        error_level: t.Optional[ErrorLevel] = None,
 891        error_message_context: int = 100,
 892        max_errors: int = 3,
 893    ):
 894        self.error_level = error_level or ErrorLevel.IMMEDIATE
 895        self.error_message_context = error_message_context
 896        self.max_errors = max_errors
 897        self._tokenizer = self.TOKENIZER_CLASS()
 898        self.reset()
 899
 900    def reset(self):
 901        self.sql = ""
 902        self.errors = []
 903        self._tokens = []
 904        self._index = 0
 905        self._curr = None
 906        self._next = None
 907        self._prev = None
 908        self._prev_comments = None
 909
 910    def parse(
 911        self, raw_tokens: t.List[Token], sql: t.Optional[str] = None
 912    ) -> t.List[t.Optional[exp.Expression]]:
 913        """
 914        Parses a list of tokens and returns a list of syntax trees, one tree
 915        per parsed SQL statement.
 916
 917        Args:
 918            raw_tokens: The list of tokens.
 919            sql: The original SQL string, used to produce helpful debug messages.
 920
 921        Returns:
 922            The list of the produced syntax trees.
 923        """
 924        return self._parse(
 925            parse_method=self.__class__._parse_statement, raw_tokens=raw_tokens, sql=sql
 926        )
 927
 928    def parse_into(
 929        self,
 930        expression_types: exp.IntoType,
 931        raw_tokens: t.List[Token],
 932        sql: t.Optional[str] = None,
 933    ) -> t.List[t.Optional[exp.Expression]]:
 934        """
 935        Parses a list of tokens into a given Expression type. If a collection of Expression
 936        types is given instead, this method will try to parse the token list into each one
 937        of them, stopping at the first for which the parsing succeeds.
 938
 939        Args:
 940            expression_types: The expression type(s) to try and parse the token list into.
 941            raw_tokens: The list of tokens.
 942            sql: The original SQL string, used to produce helpful debug messages.
 943
 944        Returns:
 945            The target Expression.
 946        """
 947        errors = []
 948        for expression_type in ensure_list(expression_types):
 949            parser = self.EXPRESSION_PARSERS.get(expression_type)
 950            if not parser:
 951                raise TypeError(f"No parser registered for {expression_type}")
 952
 953            try:
 954                return self._parse(parser, raw_tokens, sql)
 955            except ParseError as e:
 956                e.errors[0]["into_expression"] = expression_type
 957                errors.append(e)
 958
 959        raise ParseError(
 960            f"Failed to parse '{sql or raw_tokens}' into {expression_types}",
 961            errors=merge_errors(errors),
 962        ) from errors[-1]
 963
 964    def _parse(
 965        self,
 966        parse_method: t.Callable[[Parser], t.Optional[exp.Expression]],
 967        raw_tokens: t.List[Token],
 968        sql: t.Optional[str] = None,
 969    ) -> t.List[t.Optional[exp.Expression]]:
 970        self.reset()
 971        self.sql = sql or ""
 972
 973        total = len(raw_tokens)
 974        chunks: t.List[t.List[Token]] = [[]]
 975
 976        for i, token in enumerate(raw_tokens):
 977            if token.token_type == TokenType.SEMICOLON:
 978                if i < total - 1:
 979                    chunks.append([])
 980            else:
 981                chunks[-1].append(token)
 982
 983        expressions = []
 984
 985        for tokens in chunks:
 986            self._index = -1
 987            self._tokens = tokens
 988            self._advance()
 989
 990            expressions.append(parse_method(self))
 991
 992            if self._index < len(self._tokens):
 993                self.raise_error("Invalid expression / Unexpected token")
 994
 995            self.check_errors()
 996
 997        return expressions
 998
 999    def check_errors(self) -> None:
1000        """Logs or raises any found errors, depending on the chosen error level setting."""
1001        if self.error_level == ErrorLevel.WARN:
1002            for error in self.errors:
1003                logger.error(str(error))
1004        elif self.error_level == ErrorLevel.RAISE and self.errors:
1005            raise ParseError(
1006                concat_messages(self.errors, self.max_errors),
1007                errors=merge_errors(self.errors),
1008            )
1009
1010    def raise_error(self, message: str, token: t.Optional[Token] = None) -> None:
1011        """
1012        Appends an error in the list of recorded errors or raises it, depending on the chosen
1013        error level setting.
1014        """
1015        token = token or self._curr or self._prev or Token.string("")
1016        start = token.start
1017        end = token.end + 1
1018        start_context = self.sql[max(start - self.error_message_context, 0) : start]
1019        highlight = self.sql[start:end]
1020        end_context = self.sql[end : end + self.error_message_context]
1021
1022        error = ParseError.new(
1023            f"{message}. Line {token.line}, Col: {token.col}.\n"
1024            f"  {start_context}\033[4m{highlight}\033[0m{end_context}",
1025            description=message,
1026            line=token.line,
1027            col=token.col,
1028            start_context=start_context,
1029            highlight=highlight,
1030            end_context=end_context,
1031        )
1032
1033        if self.error_level == ErrorLevel.IMMEDIATE:
1034            raise error
1035
1036        self.errors.append(error)
1037
1038    def expression(
1039        self, exp_class: t.Type[E], comments: t.Optional[t.List[str]] = None, **kwargs
1040    ) -> E:
1041        """
1042        Creates a new, validated Expression.
1043
1044        Args:
1045            exp_class: The expression class to instantiate.
1046            comments: An optional list of comments to attach to the expression.
1047            kwargs: The arguments to set for the expression along with their respective values.
1048
1049        Returns:
1050            The target expression.
1051        """
1052        instance = exp_class(**kwargs)
1053        instance.add_comments(comments) if comments else self._add_comments(instance)
1054        return self.validate_expression(instance)
1055
1056    def _add_comments(self, expression: t.Optional[exp.Expression]) -> None:
1057        if expression and self._prev_comments:
1058            expression.add_comments(self._prev_comments)
1059            self._prev_comments = None
1060
1061    def validate_expression(self, expression: E, args: t.Optional[t.List] = None) -> E:
1062        """
1063        Validates an Expression, making sure that all its mandatory arguments are set.
1064
1065        Args:
1066            expression: The expression to validate.
1067            args: An optional list of items that was used to instantiate the expression, if it's a Func.
1068
1069        Returns:
1070            The validated expression.
1071        """
1072        if self.error_level != ErrorLevel.IGNORE:
1073            for error_message in expression.error_messages(args):
1074                self.raise_error(error_message)
1075
1076        return expression
1077
1078    def _find_sql(self, start: Token, end: Token) -> str:
1079        return self.sql[start.start : end.end + 1]
1080
1081    def _advance(self, times: int = 1) -> None:
1082        self._index += times
1083        self._curr = seq_get(self._tokens, self._index)
1084        self._next = seq_get(self._tokens, self._index + 1)
1085
1086        if self._index > 0:
1087            self._prev = self._tokens[self._index - 1]
1088            self._prev_comments = self._prev.comments
1089        else:
1090            self._prev = None
1091            self._prev_comments = None
1092
1093    def _retreat(self, index: int) -> None:
1094        if index != self._index:
1095            self._advance(index - self._index)
1096
1097    def _parse_command(self) -> exp.Command:
1098        return self.expression(exp.Command, this=self._prev.text, expression=self._parse_string())
1099
1100    def _parse_comment(self, allow_exists: bool = True) -> exp.Expression:
1101        start = self._prev
1102        exists = self._parse_exists() if allow_exists else None
1103
1104        self._match(TokenType.ON)
1105
1106        kind = self._match_set(self.CREATABLES) and self._prev
1107        if not kind:
1108            return self._parse_as_command(start)
1109
1110        if kind.token_type in (TokenType.FUNCTION, TokenType.PROCEDURE):
1111            this = self._parse_user_defined_function(kind=kind.token_type)
1112        elif kind.token_type == TokenType.TABLE:
1113            this = self._parse_table(alias_tokens=self.COMMENT_TABLE_ALIAS_TOKENS)
1114        elif kind.token_type == TokenType.COLUMN:
1115            this = self._parse_column()
1116        else:
1117            this = self._parse_id_var()
1118
1119        self._match(TokenType.IS)
1120
1121        return self.expression(
1122            exp.Comment, this=this, kind=kind.text, expression=self._parse_string(), exists=exists
1123        )
1124
1125    def _parse_to_table(
1126        self,
1127    ) -> exp.ToTableProperty:
1128        table = self._parse_table_parts(schema=True)
1129        return self.expression(exp.ToTableProperty, this=table)
1130
1131    # https://clickhouse.com/docs/en/engines/table-engines/mergetree-family/mergetree#mergetree-table-ttl
1132    def _parse_ttl(self) -> exp.Expression:
1133        def _parse_ttl_action() -> t.Optional[exp.Expression]:
1134            this = self._parse_bitwise()
1135
1136            if self._match_text_seq("DELETE"):
1137                return self.expression(exp.MergeTreeTTLAction, this=this, delete=True)
1138            if self._match_text_seq("RECOMPRESS"):
1139                return self.expression(
1140                    exp.MergeTreeTTLAction, this=this, recompress=self._parse_bitwise()
1141                )
1142            if self._match_text_seq("TO", "DISK"):
1143                return self.expression(
1144                    exp.MergeTreeTTLAction, this=this, to_disk=self._parse_string()
1145                )
1146            if self._match_text_seq("TO", "VOLUME"):
1147                return self.expression(
1148                    exp.MergeTreeTTLAction, this=this, to_volume=self._parse_string()
1149                )
1150
1151            return this
1152
1153        expressions = self._parse_csv(_parse_ttl_action)
1154        where = self._parse_where()
1155        group = self._parse_group()
1156
1157        aggregates = None
1158        if group and self._match(TokenType.SET):
1159            aggregates = self._parse_csv(self._parse_set_item)
1160
1161        return self.expression(
1162            exp.MergeTreeTTL,
1163            expressions=expressions,
1164            where=where,
1165            group=group,
1166            aggregates=aggregates,
1167        )
1168
1169    def _parse_statement(self) -> t.Optional[exp.Expression]:
1170        if self._curr is None:
1171            return None
1172
1173        if self._match_set(self.STATEMENT_PARSERS):
1174            return self.STATEMENT_PARSERS[self._prev.token_type](self)
1175
1176        if self._match_set(Tokenizer.COMMANDS):
1177            return self._parse_command()
1178
1179        expression = self._parse_expression()
1180        expression = self._parse_set_operations(expression) if expression else self._parse_select()
1181        return self._parse_query_modifiers(expression)
1182
1183    def _parse_drop(self, exists: bool = False) -> exp.Drop | exp.Command:
1184        start = self._prev
1185        temporary = self._match(TokenType.TEMPORARY)
1186        materialized = self._match_text_seq("MATERIALIZED")
1187
1188        kind = self._match_set(self.CREATABLES) and self._prev.text
1189        if not kind:
1190            return self._parse_as_command(start)
1191
1192        return self.expression(
1193            exp.Drop,
1194            comments=start.comments,
1195            exists=exists or self._parse_exists(),
1196            this=self._parse_table(schema=True),
1197            kind=kind,
1198            temporary=temporary,
1199            materialized=materialized,
1200            cascade=self._match_text_seq("CASCADE"),
1201            constraints=self._match_text_seq("CONSTRAINTS"),
1202            purge=self._match_text_seq("PURGE"),
1203        )
1204
1205    def _parse_exists(self, not_: bool = False) -> t.Optional[bool]:
1206        return (
1207            self._match_text_seq("IF")
1208            and (not not_ or self._match(TokenType.NOT))
1209            and self._match(TokenType.EXISTS)
1210        )
1211
1212    def _parse_create(self) -> exp.Create | exp.Command:
1213        # Note: this can't be None because we've matched a statement parser
1214        start = self._prev
1215        comments = self._prev_comments
1216
1217        replace = start.text.upper() == "REPLACE" or self._match_pair(
1218            TokenType.OR, TokenType.REPLACE
1219        )
1220        unique = self._match(TokenType.UNIQUE)
1221
1222        if self._match_pair(TokenType.TABLE, TokenType.FUNCTION, advance=False):
1223            self._advance()
1224
1225        properties = None
1226        create_token = self._match_set(self.CREATABLES) and self._prev
1227
1228        if not create_token:
1229            # exp.Properties.Location.POST_CREATE
1230            properties = self._parse_properties()
1231            create_token = self._match_set(self.CREATABLES) and self._prev
1232
1233            if not properties or not create_token:
1234                return self._parse_as_command(start)
1235
1236        exists = self._parse_exists(not_=True)
1237        this = None
1238        expression: t.Optional[exp.Expression] = None
1239        indexes = None
1240        no_schema_binding = None
1241        begin = None
1242        clone = None
1243
1244        def extend_props(temp_props: t.Optional[exp.Properties]) -> None:
1245            nonlocal properties
1246            if properties and temp_props:
1247                properties.expressions.extend(temp_props.expressions)
1248            elif temp_props:
1249                properties = temp_props
1250
1251        if create_token.token_type in (TokenType.FUNCTION, TokenType.PROCEDURE):
1252            this = self._parse_user_defined_function(kind=create_token.token_type)
1253
1254            # exp.Properties.Location.POST_SCHEMA ("schema" here is the UDF's type signature)
1255            extend_props(self._parse_properties())
1256
1257            self._match(TokenType.ALIAS)
1258
1259            if self._match(TokenType.COMMAND):
1260                expression = self._parse_as_command(self._prev)
1261            else:
1262                begin = self._match(TokenType.BEGIN)
1263                return_ = self._match_text_seq("RETURN")
1264                expression = self._parse_statement()
1265
1266                if return_:
1267                    expression = self.expression(exp.Return, this=expression)
1268        elif create_token.token_type == TokenType.INDEX:
1269            this = self._parse_index(index=self._parse_id_var())
1270        elif create_token.token_type in self.DB_CREATABLES:
1271            table_parts = self._parse_table_parts(schema=True)
1272
1273            # exp.Properties.Location.POST_NAME
1274            self._match(TokenType.COMMA)
1275            extend_props(self._parse_properties(before=True))
1276
1277            this = self._parse_schema(this=table_parts)
1278
1279            # exp.Properties.Location.POST_SCHEMA and POST_WITH
1280            extend_props(self._parse_properties())
1281
1282            self._match(TokenType.ALIAS)
1283            if not self._match_set(self.DDL_SELECT_TOKENS, advance=False):
1284                # exp.Properties.Location.POST_ALIAS
1285                extend_props(self._parse_properties())
1286
1287            expression = self._parse_ddl_select()
1288
1289            if create_token.token_type == TokenType.TABLE:
1290                # exp.Properties.Location.POST_EXPRESSION
1291                extend_props(self._parse_properties())
1292
1293                indexes = []
1294                while True:
1295                    index = self._parse_index()
1296
1297                    # exp.Properties.Location.POST_INDEX
1298                    extend_props(self._parse_properties())
1299
1300                    if not index:
1301                        break
1302                    else:
1303                        self._match(TokenType.COMMA)
1304                        indexes.append(index)
1305            elif create_token.token_type == TokenType.VIEW:
1306                if self._match_text_seq("WITH", "NO", "SCHEMA", "BINDING"):
1307                    no_schema_binding = True
1308
1309            shallow = self._match_text_seq("SHALLOW")
1310
1311            if self._match_text_seq("CLONE"):
1312                clone = self._parse_table(schema=True)
1313                when = self._match_texts({"AT", "BEFORE"}) and self._prev.text.upper()
1314                clone_kind = (
1315                    self._match(TokenType.L_PAREN)
1316                    and self._match_texts(self.CLONE_KINDS)
1317                    and self._prev.text.upper()
1318                )
1319                clone_expression = self._match(TokenType.FARROW) and self._parse_bitwise()
1320                self._match(TokenType.R_PAREN)
1321                clone = self.expression(
1322                    exp.Clone,
1323                    this=clone,
1324                    when=when,
1325                    kind=clone_kind,
1326                    shallow=shallow,
1327                    expression=clone_expression,
1328                )
1329
1330        return self.expression(
1331            exp.Create,
1332            comments=comments,
1333            this=this,
1334            kind=create_token.text,
1335            replace=replace,
1336            unique=unique,
1337            expression=expression,
1338            exists=exists,
1339            properties=properties,
1340            indexes=indexes,
1341            no_schema_binding=no_schema_binding,
1342            begin=begin,
1343            clone=clone,
1344        )
1345
1346    def _parse_property_before(self) -> t.Optional[exp.Expression]:
1347        # only used for teradata currently
1348        self._match(TokenType.COMMA)
1349
1350        kwargs = {
1351            "no": self._match_text_seq("NO"),
1352            "dual": self._match_text_seq("DUAL"),
1353            "before": self._match_text_seq("BEFORE"),
1354            "default": self._match_text_seq("DEFAULT"),
1355            "local": (self._match_text_seq("LOCAL") and "LOCAL")
1356            or (self._match_text_seq("NOT", "LOCAL") and "NOT LOCAL"),
1357            "after": self._match_text_seq("AFTER"),
1358            "minimum": self._match_texts(("MIN", "MINIMUM")),
1359            "maximum": self._match_texts(("MAX", "MAXIMUM")),
1360        }
1361
1362        if self._match_texts(self.PROPERTY_PARSERS):
1363            parser = self.PROPERTY_PARSERS[self._prev.text.upper()]
1364            try:
1365                return parser(self, **{k: v for k, v in kwargs.items() if v})
1366            except TypeError:
1367                self.raise_error(f"Cannot parse property '{self._prev.text}'")
1368
1369        return None
1370
1371    def _parse_property(self) -> t.Optional[exp.Expression]:
1372        if self._match_texts(self.PROPERTY_PARSERS):
1373            return self.PROPERTY_PARSERS[self._prev.text.upper()](self)
1374
1375        if self._match_pair(TokenType.DEFAULT, TokenType.CHARACTER_SET):
1376            return self._parse_character_set(default=True)
1377
1378        if self._match_text_seq("COMPOUND", "SORTKEY"):
1379            return self._parse_sortkey(compound=True)
1380
1381        if self._match_text_seq("SQL", "SECURITY"):
1382            return self.expression(exp.SqlSecurityProperty, definer=self._match_text_seq("DEFINER"))
1383
1384        assignment = self._match_pair(
1385            TokenType.VAR, TokenType.EQ, advance=False
1386        ) or self._match_pair(TokenType.STRING, TokenType.EQ, advance=False)
1387
1388        if assignment:
1389            key = self._parse_var_or_string()
1390            self._match(TokenType.EQ)
1391            return self.expression(
1392                exp.Property,
1393                this=key,
1394                value=self._parse_column() or self._parse_var(any_token=True),
1395            )
1396
1397        return None
1398
1399    def _parse_stored(self) -> exp.FileFormatProperty:
1400        self._match(TokenType.ALIAS)
1401
1402        input_format = self._parse_string() if self._match_text_seq("INPUTFORMAT") else None
1403        output_format = self._parse_string() if self._match_text_seq("OUTPUTFORMAT") else None
1404
1405        return self.expression(
1406            exp.FileFormatProperty,
1407            this=self.expression(
1408                exp.InputOutputFormat, input_format=input_format, output_format=output_format
1409            )
1410            if input_format or output_format
1411            else self._parse_var_or_string() or self._parse_number() or self._parse_id_var(),
1412        )
1413
1414    def _parse_property_assignment(self, exp_class: t.Type[E]) -> E:
1415        self._match(TokenType.EQ)
1416        self._match(TokenType.ALIAS)
1417        return self.expression(exp_class, this=self._parse_field())
1418
1419    def _parse_properties(self, before: t.Optional[bool] = None) -> t.Optional[exp.Properties]:
1420        properties = []
1421        while True:
1422            if before:
1423                prop = self._parse_property_before()
1424            else:
1425                prop = self._parse_property()
1426
1427            if not prop:
1428                break
1429            for p in ensure_list(prop):
1430                properties.append(p)
1431
1432        if properties:
1433            return self.expression(exp.Properties, expressions=properties)
1434
1435        return None
1436
1437    def _parse_fallback(self, no: bool = False) -> exp.FallbackProperty:
1438        return self.expression(
1439            exp.FallbackProperty, no=no, protection=self._match_text_seq("PROTECTION")
1440        )
1441
1442    def _parse_volatile_property(self) -> exp.VolatileProperty | exp.StabilityProperty:
1443        if self._index >= 2:
1444            pre_volatile_token = self._tokens[self._index - 2]
1445        else:
1446            pre_volatile_token = None
1447
1448        if pre_volatile_token and pre_volatile_token.token_type in self.PRE_VOLATILE_TOKENS:
1449            return exp.VolatileProperty()
1450
1451        return self.expression(exp.StabilityProperty, this=exp.Literal.string("VOLATILE"))
1452
1453    def _parse_with_property(
1454        self,
1455    ) -> t.Optional[exp.Expression] | t.List[exp.Expression]:
1456        if self._match(TokenType.L_PAREN, advance=False):
1457            return self._parse_wrapped_csv(self._parse_property)
1458
1459        if self._match_text_seq("JOURNAL"):
1460            return self._parse_withjournaltable()
1461
1462        if self._match_text_seq("DATA"):
1463            return self._parse_withdata(no=False)
1464        elif self._match_text_seq("NO", "DATA"):
1465            return self._parse_withdata(no=True)
1466
1467        if not self._next:
1468            return None
1469
1470        return self._parse_withisolatedloading()
1471
1472    # https://dev.mysql.com/doc/refman/8.0/en/create-view.html
1473    def _parse_definer(self) -> t.Optional[exp.DefinerProperty]:
1474        self._match(TokenType.EQ)
1475
1476        user = self._parse_id_var()
1477        self._match(TokenType.PARAMETER)
1478        host = self._parse_id_var() or (self._match(TokenType.MOD) and self._prev.text)
1479
1480        if not user or not host:
1481            return None
1482
1483        return exp.DefinerProperty(this=f"{user}@{host}")
1484
1485    def _parse_withjournaltable(self) -> exp.WithJournalTableProperty:
1486        self._match(TokenType.TABLE)
1487        self._match(TokenType.EQ)
1488        return self.expression(exp.WithJournalTableProperty, this=self._parse_table_parts())
1489
1490    def _parse_log(self, no: bool = False) -> exp.LogProperty:
1491        return self.expression(exp.LogProperty, no=no)
1492
1493    def _parse_journal(self, **kwargs) -> exp.JournalProperty:
1494        return self.expression(exp.JournalProperty, **kwargs)
1495
1496    def _parse_checksum(self) -> exp.ChecksumProperty:
1497        self._match(TokenType.EQ)
1498
1499        on = None
1500        if self._match(TokenType.ON):
1501            on = True
1502        elif self._match_text_seq("OFF"):
1503            on = False
1504
1505        return self.expression(exp.ChecksumProperty, on=on, default=self._match(TokenType.DEFAULT))
1506
1507    def _parse_cluster(self) -> exp.Cluster:
1508        return self.expression(exp.Cluster, expressions=self._parse_csv(self._parse_ordered))
1509
1510    def _parse_clustered_by(self) -> exp.ClusteredByProperty:
1511        self._match_text_seq("BY")
1512
1513        self._match_l_paren()
1514        expressions = self._parse_csv(self._parse_column)
1515        self._match_r_paren()
1516
1517        if self._match_text_seq("SORTED", "BY"):
1518            self._match_l_paren()
1519            sorted_by = self._parse_csv(self._parse_ordered)
1520            self._match_r_paren()
1521        else:
1522            sorted_by = None
1523
1524        self._match(TokenType.INTO)
1525        buckets = self._parse_number()
1526        self._match_text_seq("BUCKETS")
1527
1528        return self.expression(
1529            exp.ClusteredByProperty,
1530            expressions=expressions,
1531            sorted_by=sorted_by,
1532            buckets=buckets,
1533        )
1534
1535    def _parse_copy_property(self) -> t.Optional[exp.CopyGrantsProperty]:
1536        if not self._match_text_seq("GRANTS"):
1537            self._retreat(self._index - 1)
1538            return None
1539
1540        return self.expression(exp.CopyGrantsProperty)
1541
1542    def _parse_freespace(self) -> exp.FreespaceProperty:
1543        self._match(TokenType.EQ)
1544        return self.expression(
1545            exp.FreespaceProperty, this=self._parse_number(), percent=self._match(TokenType.PERCENT)
1546        )
1547
1548    def _parse_mergeblockratio(
1549        self, no: bool = False, default: bool = False
1550    ) -> exp.MergeBlockRatioProperty:
1551        if self._match(TokenType.EQ):
1552            return self.expression(
1553                exp.MergeBlockRatioProperty,
1554                this=self._parse_number(),
1555                percent=self._match(TokenType.PERCENT),
1556            )
1557
1558        return self.expression(exp.MergeBlockRatioProperty, no=no, default=default)
1559
1560    def _parse_datablocksize(
1561        self,
1562        default: t.Optional[bool] = None,
1563        minimum: t.Optional[bool] = None,
1564        maximum: t.Optional[bool] = None,
1565    ) -> exp.DataBlocksizeProperty:
1566        self._match(TokenType.EQ)
1567        size = self._parse_number()
1568
1569        units = None
1570        if self._match_texts(("BYTES", "KBYTES", "KILOBYTES")):
1571            units = self._prev.text
1572
1573        return self.expression(
1574            exp.DataBlocksizeProperty,
1575            size=size,
1576            units=units,
1577            default=default,
1578            minimum=minimum,
1579            maximum=maximum,
1580        )
1581
1582    def _parse_blockcompression(self) -> exp.BlockCompressionProperty:
1583        self._match(TokenType.EQ)
1584        always = self._match_text_seq("ALWAYS")
1585        manual = self._match_text_seq("MANUAL")
1586        never = self._match_text_seq("NEVER")
1587        default = self._match_text_seq("DEFAULT")
1588
1589        autotemp = None
1590        if self._match_text_seq("AUTOTEMP"):
1591            autotemp = self._parse_schema()
1592
1593        return self.expression(
1594            exp.BlockCompressionProperty,
1595            always=always,
1596            manual=manual,
1597            never=never,
1598            default=default,
1599            autotemp=autotemp,
1600        )
1601
1602    def _parse_withisolatedloading(self) -> exp.IsolatedLoadingProperty:
1603        no = self._match_text_seq("NO")
1604        concurrent = self._match_text_seq("CONCURRENT")
1605        self._match_text_seq("ISOLATED", "LOADING")
1606        for_all = self._match_text_seq("FOR", "ALL")
1607        for_insert = self._match_text_seq("FOR", "INSERT")
1608        for_none = self._match_text_seq("FOR", "NONE")
1609        return self.expression(
1610            exp.IsolatedLoadingProperty,
1611            no=no,
1612            concurrent=concurrent,
1613            for_all=for_all,
1614            for_insert=for_insert,
1615            for_none=for_none,
1616        )
1617
1618    def _parse_locking(self) -> exp.LockingProperty:
1619        if self._match(TokenType.TABLE):
1620            kind = "TABLE"
1621        elif self._match(TokenType.VIEW):
1622            kind = "VIEW"
1623        elif self._match(TokenType.ROW):
1624            kind = "ROW"
1625        elif self._match_text_seq("DATABASE"):
1626            kind = "DATABASE"
1627        else:
1628            kind = None
1629
1630        if kind in ("DATABASE", "TABLE", "VIEW"):
1631            this = self._parse_table_parts()
1632        else:
1633            this = None
1634
1635        if self._match(TokenType.FOR):
1636            for_or_in = "FOR"
1637        elif self._match(TokenType.IN):
1638            for_or_in = "IN"
1639        else:
1640            for_or_in = None
1641
1642        if self._match_text_seq("ACCESS"):
1643            lock_type = "ACCESS"
1644        elif self._match_texts(("EXCL", "EXCLUSIVE")):
1645            lock_type = "EXCLUSIVE"
1646        elif self._match_text_seq("SHARE"):
1647            lock_type = "SHARE"
1648        elif self._match_text_seq("READ"):
1649            lock_type = "READ"
1650        elif self._match_text_seq("WRITE"):
1651            lock_type = "WRITE"
1652        elif self._match_text_seq("CHECKSUM"):
1653            lock_type = "CHECKSUM"
1654        else:
1655            lock_type = None
1656
1657        override = self._match_text_seq("OVERRIDE")
1658
1659        return self.expression(
1660            exp.LockingProperty,
1661            this=this,
1662            kind=kind,
1663            for_or_in=for_or_in,
1664            lock_type=lock_type,
1665            override=override,
1666        )
1667
1668    def _parse_partition_by(self) -> t.List[exp.Expression]:
1669        if self._match(TokenType.PARTITION_BY):
1670            return self._parse_csv(self._parse_conjunction)
1671        return []
1672
1673    def _parse_partitioned_by(self) -> exp.PartitionedByProperty:
1674        self._match(TokenType.EQ)
1675        return self.expression(
1676            exp.PartitionedByProperty,
1677            this=self._parse_schema() or self._parse_bracket(self._parse_field()),
1678        )
1679
1680    def _parse_withdata(self, no: bool = False) -> exp.WithDataProperty:
1681        if self._match_text_seq("AND", "STATISTICS"):
1682            statistics = True
1683        elif self._match_text_seq("AND", "NO", "STATISTICS"):
1684            statistics = False
1685        else:
1686            statistics = None
1687
1688        return self.expression(exp.WithDataProperty, no=no, statistics=statistics)
1689
1690    def _parse_no_property(self) -> t.Optional[exp.NoPrimaryIndexProperty]:
1691        if self._match_text_seq("PRIMARY", "INDEX"):
1692            return exp.NoPrimaryIndexProperty()
1693        return None
1694
1695    def _parse_on_property(self) -> t.Optional[exp.Expression]:
1696        if self._match_text_seq("COMMIT", "PRESERVE", "ROWS"):
1697            return exp.OnCommitProperty()
1698        if self._match_text_seq("COMMIT", "DELETE", "ROWS"):
1699            return exp.OnCommitProperty(delete=True)
1700        return self.expression(exp.OnProperty, this=self._parse_schema(self._parse_id_var()))
1701
1702    def _parse_distkey(self) -> exp.DistKeyProperty:
1703        return self.expression(exp.DistKeyProperty, this=self._parse_wrapped(self._parse_id_var))
1704
1705    def _parse_create_like(self) -> t.Optional[exp.LikeProperty]:
1706        table = self._parse_table(schema=True)
1707
1708        options = []
1709        while self._match_texts(("INCLUDING", "EXCLUDING")):
1710            this = self._prev.text.upper()
1711
1712            id_var = self._parse_id_var()
1713            if not id_var:
1714                return None
1715
1716            options.append(
1717                self.expression(exp.Property, this=this, value=exp.var(id_var.this.upper()))
1718            )
1719
1720        return self.expression(exp.LikeProperty, this=table, expressions=options)
1721
1722    def _parse_sortkey(self, compound: bool = False) -> exp.SortKeyProperty:
1723        return self.expression(
1724            exp.SortKeyProperty, this=self._parse_wrapped_id_vars(), compound=compound
1725        )
1726
1727    def _parse_character_set(self, default: bool = False) -> exp.CharacterSetProperty:
1728        self._match(TokenType.EQ)
1729        return self.expression(
1730            exp.CharacterSetProperty, this=self._parse_var_or_string(), default=default
1731        )
1732
1733    def _parse_returns(self) -> exp.ReturnsProperty:
1734        value: t.Optional[exp.Expression]
1735        is_table = self._match(TokenType.TABLE)
1736
1737        if is_table:
1738            if self._match(TokenType.LT):
1739                value = self.expression(
1740                    exp.Schema,
1741                    this="TABLE",
1742                    expressions=self._parse_csv(self._parse_struct_types),
1743                )
1744                if not self._match(TokenType.GT):
1745                    self.raise_error("Expecting >")
1746            else:
1747                value = self._parse_schema(exp.var("TABLE"))
1748        else:
1749            value = self._parse_types()
1750
1751        return self.expression(exp.ReturnsProperty, this=value, is_table=is_table)
1752
1753    def _parse_describe(self) -> exp.Describe:
1754        kind = self._match_set(self.CREATABLES) and self._prev.text
1755        this = self._parse_table()
1756        return self.expression(exp.Describe, this=this, kind=kind)
1757
1758    def _parse_insert(self) -> exp.Insert:
1759        comments = ensure_list(self._prev_comments)
1760        overwrite = self._match(TokenType.OVERWRITE)
1761        ignore = self._match(TokenType.IGNORE)
1762        local = self._match_text_seq("LOCAL")
1763        alternative = None
1764
1765        if self._match_text_seq("DIRECTORY"):
1766            this: t.Optional[exp.Expression] = self.expression(
1767                exp.Directory,
1768                this=self._parse_var_or_string(),
1769                local=local,
1770                row_format=self._parse_row_format(match_row=True),
1771            )
1772        else:
1773            if self._match(TokenType.OR):
1774                alternative = self._match_texts(self.INSERT_ALTERNATIVES) and self._prev.text
1775
1776            self._match(TokenType.INTO)
1777            comments += ensure_list(self._prev_comments)
1778            self._match(TokenType.TABLE)
1779            this = self._parse_table(schema=True)
1780
1781        returning = self._parse_returning()
1782
1783        return self.expression(
1784            exp.Insert,
1785            comments=comments,
1786            this=this,
1787            by_name=self._match_text_seq("BY", "NAME"),
1788            exists=self._parse_exists(),
1789            partition=self._parse_partition(),
1790            where=self._match_pair(TokenType.REPLACE, TokenType.WHERE)
1791            and self._parse_conjunction(),
1792            expression=self._parse_ddl_select(),
1793            conflict=self._parse_on_conflict(),
1794            returning=returning or self._parse_returning(),
1795            overwrite=overwrite,
1796            alternative=alternative,
1797            ignore=ignore,
1798        )
1799
1800    def _parse_on_conflict(self) -> t.Optional[exp.OnConflict]:
1801        conflict = self._match_text_seq("ON", "CONFLICT")
1802        duplicate = self._match_text_seq("ON", "DUPLICATE", "KEY")
1803
1804        if not conflict and not duplicate:
1805            return None
1806
1807        nothing = None
1808        expressions = None
1809        key = None
1810        constraint = None
1811
1812        if conflict:
1813            if self._match_text_seq("ON", "CONSTRAINT"):
1814                constraint = self._parse_id_var()
1815            else:
1816                key = self._parse_csv(self._parse_value)
1817
1818        self._match_text_seq("DO")
1819        if self._match_text_seq("NOTHING"):
1820            nothing = True
1821        else:
1822            self._match(TokenType.UPDATE)
1823            self._match(TokenType.SET)
1824            expressions = self._parse_csv(self._parse_equality)
1825
1826        return self.expression(
1827            exp.OnConflict,
1828            duplicate=duplicate,
1829            expressions=expressions,
1830            nothing=nothing,
1831            key=key,
1832            constraint=constraint,
1833        )
1834
1835    def _parse_returning(self) -> t.Optional[exp.Returning]:
1836        if not self._match(TokenType.RETURNING):
1837            return None
1838        return self.expression(
1839            exp.Returning,
1840            expressions=self._parse_csv(self._parse_expression),
1841            into=self._match(TokenType.INTO) and self._parse_table_part(),
1842        )
1843
1844    def _parse_row(self) -> t.Optional[exp.RowFormatSerdeProperty | exp.RowFormatDelimitedProperty]:
1845        if not self._match(TokenType.FORMAT):
1846            return None
1847        return self._parse_row_format()
1848
1849    def _parse_row_format(
1850        self, match_row: bool = False
1851    ) -> t.Optional[exp.RowFormatSerdeProperty | exp.RowFormatDelimitedProperty]:
1852        if match_row and not self._match_pair(TokenType.ROW, TokenType.FORMAT):
1853            return None
1854
1855        if self._match_text_seq("SERDE"):
1856            this = self._parse_string()
1857
1858            serde_properties = None
1859            if self._match(TokenType.SERDE_PROPERTIES):
1860                serde_properties = self.expression(
1861                    exp.SerdeProperties, expressions=self._parse_wrapped_csv(self._parse_property)
1862                )
1863
1864            return self.expression(
1865                exp.RowFormatSerdeProperty, this=this, serde_properties=serde_properties
1866            )
1867
1868        self._match_text_seq("DELIMITED")
1869
1870        kwargs = {}
1871
1872        if self._match_text_seq("FIELDS", "TERMINATED", "BY"):
1873            kwargs["fields"] = self._parse_string()
1874            if self._match_text_seq("ESCAPED", "BY"):
1875                kwargs["escaped"] = self._parse_string()
1876        if self._match_text_seq("COLLECTION", "ITEMS", "TERMINATED", "BY"):
1877            kwargs["collection_items"] = self._parse_string()
1878        if self._match_text_seq("MAP", "KEYS", "TERMINATED", "BY"):
1879            kwargs["map_keys"] = self._parse_string()
1880        if self._match_text_seq("LINES", "TERMINATED", "BY"):
1881            kwargs["lines"] = self._parse_string()
1882        if self._match_text_seq("NULL", "DEFINED", "AS"):
1883            kwargs["null"] = self._parse_string()
1884
1885        return self.expression(exp.RowFormatDelimitedProperty, **kwargs)  # type: ignore
1886
1887    def _parse_load(self) -> exp.LoadData | exp.Command:
1888        if self._match_text_seq("DATA"):
1889            local = self._match_text_seq("LOCAL")
1890            self._match_text_seq("INPATH")
1891            inpath = self._parse_string()
1892            overwrite = self._match(TokenType.OVERWRITE)
1893            self._match_pair(TokenType.INTO, TokenType.TABLE)
1894
1895            return self.expression(
1896                exp.LoadData,
1897                this=self._parse_table(schema=True),
1898                local=local,
1899                overwrite=overwrite,
1900                inpath=inpath,
1901                partition=self._parse_partition(),
1902                input_format=self._match_text_seq("INPUTFORMAT") and self._parse_string(),
1903                serde=self._match_text_seq("SERDE") and self._parse_string(),
1904            )
1905        return self._parse_as_command(self._prev)
1906
1907    def _parse_delete(self) -> exp.Delete:
1908        # This handles MySQL's "Multiple-Table Syntax"
1909        # https://dev.mysql.com/doc/refman/8.0/en/delete.html
1910        tables = None
1911        comments = self._prev_comments
1912        if not self._match(TokenType.FROM, advance=False):
1913            tables = self._parse_csv(self._parse_table) or None
1914
1915        returning = self._parse_returning()
1916
1917        return self.expression(
1918            exp.Delete,
1919            comments=comments,
1920            tables=tables,
1921            this=self._match(TokenType.FROM) and self._parse_table(joins=True),
1922            using=self._match(TokenType.USING) and self._parse_table(joins=True),
1923            where=self._parse_where(),
1924            returning=returning or self._parse_returning(),
1925            limit=self._parse_limit(),
1926        )
1927
1928    def _parse_update(self) -> exp.Update:
1929        comments = self._prev_comments
1930        this = self._parse_table(alias_tokens=self.UPDATE_ALIAS_TOKENS)
1931        expressions = self._match(TokenType.SET) and self._parse_csv(self._parse_equality)
1932        returning = self._parse_returning()
1933        return self.expression(
1934            exp.Update,
1935            comments=comments,
1936            **{  # type: ignore
1937                "this": this,
1938                "expressions": expressions,
1939                "from": self._parse_from(joins=True),
1940                "where": self._parse_where(),
1941                "returning": returning or self._parse_returning(),
1942                "order": self._parse_order(),
1943                "limit": self._parse_limit(),
1944            },
1945        )
1946
1947    def _parse_uncache(self) -> exp.Uncache:
1948        if not self._match(TokenType.TABLE):
1949            self.raise_error("Expecting TABLE after UNCACHE")
1950
1951        return self.expression(
1952            exp.Uncache, exists=self._parse_exists(), this=self._parse_table(schema=True)
1953        )
1954
1955    def _parse_cache(self) -> exp.Cache:
1956        lazy = self._match_text_seq("LAZY")
1957        self._match(TokenType.TABLE)
1958        table = self._parse_table(schema=True)
1959
1960        options = []
1961        if self._match_text_seq("OPTIONS"):
1962            self._match_l_paren()
1963            k = self._parse_string()
1964            self._match(TokenType.EQ)
1965            v = self._parse_string()
1966            options = [k, v]
1967            self._match_r_paren()
1968
1969        self._match(TokenType.ALIAS)
1970        return self.expression(
1971            exp.Cache,
1972            this=table,
1973            lazy=lazy,
1974            options=options,
1975            expression=self._parse_select(nested=True),
1976        )
1977
1978    def _parse_partition(self) -> t.Optional[exp.Partition]:
1979        if not self._match(TokenType.PARTITION):
1980            return None
1981
1982        return self.expression(
1983            exp.Partition, expressions=self._parse_wrapped_csv(self._parse_conjunction)
1984        )
1985
1986    def _parse_value(self) -> exp.Tuple:
1987        if self._match(TokenType.L_PAREN):
1988            expressions = self._parse_csv(self._parse_conjunction)
1989            self._match_r_paren()
1990            return self.expression(exp.Tuple, expressions=expressions)
1991
1992        # In presto we can have VALUES 1, 2 which results in 1 column & 2 rows.
1993        # https://prestodb.io/docs/current/sql/values.html
1994        return self.expression(exp.Tuple, expressions=[self._parse_conjunction()])
1995
1996    def _parse_projections(self) -> t.List[exp.Expression]:
1997        return self._parse_expressions()
1998
1999    def _parse_select(
2000        self, nested: bool = False, table: bool = False, parse_subquery_alias: bool = True
2001    ) -> t.Optional[exp.Expression]:
2002        cte = self._parse_with()
2003
2004        if cte:
2005            this = self._parse_statement()
2006
2007            if not this:
2008                self.raise_error("Failed to parse any statement following CTE")
2009                return cte
2010
2011            if "with" in this.arg_types:
2012                this.set("with", cte)
2013            else:
2014                self.raise_error(f"{this.key} does not support CTE")
2015                this = cte
2016
2017            return this
2018
2019        # duckdb supports leading with FROM x
2020        from_ = self._parse_from() if self._match(TokenType.FROM, advance=False) else None
2021
2022        if self._match(TokenType.SELECT):
2023            comments = self._prev_comments
2024
2025            hint = self._parse_hint()
2026            all_ = self._match(TokenType.ALL)
2027            distinct = self._match_set(self.DISTINCT_TOKENS)
2028
2029            kind = (
2030                self._match(TokenType.ALIAS)
2031                and self._match_texts(("STRUCT", "VALUE"))
2032                and self._prev.text
2033            )
2034
2035            if distinct:
2036                distinct = self.expression(
2037                    exp.Distinct,
2038                    on=self._parse_value() if self._match(TokenType.ON) else None,
2039                )
2040
2041            if all_ and distinct:
2042                self.raise_error("Cannot specify both ALL and DISTINCT after SELECT")
2043
2044            limit = self._parse_limit(top=True)
2045            projections = self._parse_projections()
2046
2047            this = self.expression(
2048                exp.Select,
2049                kind=kind,
2050                hint=hint,
2051                distinct=distinct,
2052                expressions=projections,
2053                limit=limit,
2054            )
2055            this.comments = comments
2056
2057            into = self._parse_into()
2058            if into:
2059                this.set("into", into)
2060
2061            if not from_:
2062                from_ = self._parse_from()
2063
2064            if from_:
2065                this.set("from", from_)
2066
2067            this = self._parse_query_modifiers(this)
2068        elif (table or nested) and self._match(TokenType.L_PAREN):
2069            if self._match(TokenType.PIVOT):
2070                this = self._parse_simplified_pivot()
2071            elif self._match(TokenType.FROM):
2072                this = exp.select("*").from_(
2073                    t.cast(exp.From, self._parse_from(skip_from_token=True))
2074                )
2075            else:
2076                this = self._parse_table() if table else self._parse_select(nested=True)
2077                this = self._parse_set_operations(self._parse_query_modifiers(this))
2078
2079            self._match_r_paren()
2080
2081            # We return early here so that the UNION isn't attached to the subquery by the
2082            # following call to _parse_set_operations, but instead becomes the parent node
2083            return self._parse_subquery(this, parse_alias=parse_subquery_alias)
2084        elif self._match(TokenType.VALUES):
2085            this = self.expression(
2086                exp.Values,
2087                expressions=self._parse_csv(self._parse_value),
2088                alias=self._parse_table_alias(),
2089            )
2090        elif from_:
2091            this = exp.select("*").from_(from_.this, copy=False)
2092        else:
2093            this = None
2094
2095        return self._parse_set_operations(this)
2096
2097    def _parse_with(self, skip_with_token: bool = False) -> t.Optional[exp.With]:
2098        if not skip_with_token and not self._match(TokenType.WITH):
2099            return None
2100
2101        comments = self._prev_comments
2102        recursive = self._match(TokenType.RECURSIVE)
2103
2104        expressions = []
2105        while True:
2106            expressions.append(self._parse_cte())
2107
2108            if not self._match(TokenType.COMMA) and not self._match(TokenType.WITH):
2109                break
2110            else:
2111                self._match(TokenType.WITH)
2112
2113        return self.expression(
2114            exp.With, comments=comments, expressions=expressions, recursive=recursive
2115        )
2116
2117    def _parse_cte(self) -> exp.CTE:
2118        alias = self._parse_table_alias()
2119        if not alias or not alias.this:
2120            self.raise_error("Expected CTE to have alias")
2121
2122        self._match(TokenType.ALIAS)
2123        return self.expression(
2124            exp.CTE, this=self._parse_wrapped(self._parse_statement), alias=alias
2125        )
2126
2127    def _parse_table_alias(
2128        self, alias_tokens: t.Optional[t.Collection[TokenType]] = None
2129    ) -> t.Optional[exp.TableAlias]:
2130        any_token = self._match(TokenType.ALIAS)
2131        alias = (
2132            self._parse_id_var(any_token=any_token, tokens=alias_tokens or self.TABLE_ALIAS_TOKENS)
2133            or self._parse_string_as_identifier()
2134        )
2135
2136        index = self._index
2137        if self._match(TokenType.L_PAREN):
2138            columns = self._parse_csv(self._parse_function_parameter)
2139            self._match_r_paren() if columns else self._retreat(index)
2140        else:
2141            columns = None
2142
2143        if not alias and not columns:
2144            return None
2145
2146        return self.expression(exp.TableAlias, this=alias, columns=columns)
2147
2148    def _parse_subquery(
2149        self, this: t.Optional[exp.Expression], parse_alias: bool = True
2150    ) -> t.Optional[exp.Subquery]:
2151        if not this:
2152            return None
2153
2154        return self.expression(
2155            exp.Subquery,
2156            this=this,
2157            pivots=self._parse_pivots(),
2158            alias=self._parse_table_alias() if parse_alias else None,
2159        )
2160
2161    def _parse_query_modifiers(
2162        self, this: t.Optional[exp.Expression]
2163    ) -> t.Optional[exp.Expression]:
2164        if isinstance(this, self.MODIFIABLES):
2165            for join in iter(self._parse_join, None):
2166                this.append("joins", join)
2167            for lateral in iter(self._parse_lateral, None):
2168                this.append("laterals", lateral)
2169
2170            while True:
2171                if self._match_set(self.QUERY_MODIFIER_PARSERS, advance=False):
2172                    parser = self.QUERY_MODIFIER_PARSERS[self._curr.token_type]
2173                    key, expression = parser(self)
2174
2175                    if expression:
2176                        this.set(key, expression)
2177                        if key == "limit":
2178                            offset = expression.args.pop("offset", None)
2179                            if offset:
2180                                this.set("offset", exp.Offset(expression=offset))
2181                        continue
2182                break
2183        return this
2184
2185    def _parse_hint(self) -> t.Optional[exp.Hint]:
2186        if self._match(TokenType.HINT):
2187            hints = []
2188            for hint in iter(lambda: self._parse_csv(self._parse_function), []):
2189                hints.extend(hint)
2190
2191            if not self._match_pair(TokenType.STAR, TokenType.SLASH):
2192                self.raise_error("Expected */ after HINT")
2193
2194            return self.expression(exp.Hint, expressions=hints)
2195
2196        return None
2197
2198    def _parse_into(self) -> t.Optional[exp.Into]:
2199        if not self._match(TokenType.INTO):
2200            return None
2201
2202        temp = self._match(TokenType.TEMPORARY)
2203        unlogged = self._match_text_seq("UNLOGGED")
2204        self._match(TokenType.TABLE)
2205
2206        return self.expression(
2207            exp.Into, this=self._parse_table(schema=True), temporary=temp, unlogged=unlogged
2208        )
2209
2210    def _parse_from(
2211        self, joins: bool = False, skip_from_token: bool = False
2212    ) -> t.Optional[exp.From]:
2213        if not skip_from_token and not self._match(TokenType.FROM):
2214            return None
2215
2216        return self.expression(
2217            exp.From, comments=self._prev_comments, this=self._parse_table(joins=joins)
2218        )
2219
2220    def _parse_match_recognize(self) -> t.Optional[exp.MatchRecognize]:
2221        if not self._match(TokenType.MATCH_RECOGNIZE):
2222            return None
2223
2224        self._match_l_paren()
2225
2226        partition = self._parse_partition_by()
2227        order = self._parse_order()
2228        measures = self._parse_expressions() if self._match_text_seq("MEASURES") else None
2229
2230        if self._match_text_seq("ONE", "ROW", "PER", "MATCH"):
2231            rows = exp.var("ONE ROW PER MATCH")
2232        elif self._match_text_seq("ALL", "ROWS", "PER", "MATCH"):
2233            text = "ALL ROWS PER MATCH"
2234            if self._match_text_seq("SHOW", "EMPTY", "MATCHES"):
2235                text += f" SHOW EMPTY MATCHES"
2236            elif self._match_text_seq("OMIT", "EMPTY", "MATCHES"):
2237                text += f" OMIT EMPTY MATCHES"
2238            elif self._match_text_seq("WITH", "UNMATCHED", "ROWS"):
2239                text += f" WITH UNMATCHED ROWS"
2240            rows = exp.var(text)
2241        else:
2242            rows = None
2243
2244        if self._match_text_seq("AFTER", "MATCH", "SKIP"):
2245            text = "AFTER MATCH SKIP"
2246            if self._match_text_seq("PAST", "LAST", "ROW"):
2247                text += f" PAST LAST ROW"
2248            elif self._match_text_seq("TO", "NEXT", "ROW"):
2249                text += f" TO NEXT ROW"
2250            elif self._match_text_seq("TO", "FIRST"):
2251                text += f" TO FIRST {self._advance_any().text}"  # type: ignore
2252            elif self._match_text_seq("TO", "LAST"):
2253                text += f" TO LAST {self._advance_any().text}"  # type: ignore
2254            after = exp.var(text)
2255        else:
2256            after = None
2257
2258        if self._match_text_seq("PATTERN"):
2259            self._match_l_paren()
2260
2261            if not self._curr:
2262                self.raise_error("Expecting )", self._curr)
2263
2264            paren = 1
2265            start = self._curr
2266
2267            while self._curr and paren > 0:
2268                if self._curr.token_type == TokenType.L_PAREN:
2269                    paren += 1
2270                if self._curr.token_type == TokenType.R_PAREN:
2271                    paren -= 1
2272
2273                end = self._prev
2274                self._advance()
2275
2276            if paren > 0:
2277                self.raise_error("Expecting )", self._curr)
2278
2279            pattern = exp.var(self._find_sql(start, end))
2280        else:
2281            pattern = None
2282
2283        define = (
2284            self._parse_csv(
2285                lambda: self.expression(
2286                    exp.Alias,
2287                    alias=self._parse_id_var(any_token=True),
2288                    this=self._match(TokenType.ALIAS) and self._parse_conjunction(),
2289                )
2290            )
2291            if self._match_text_seq("DEFINE")
2292            else None
2293        )
2294
2295        self._match_r_paren()
2296
2297        return self.expression(
2298            exp.MatchRecognize,
2299            partition_by=partition,
2300            order=order,
2301            measures=measures,
2302            rows=rows,
2303            after=after,
2304            pattern=pattern,
2305            define=define,
2306            alias=self._parse_table_alias(),
2307        )
2308
2309    def _parse_lateral(self) -> t.Optional[exp.Lateral]:
2310        outer_apply = self._match_pair(TokenType.OUTER, TokenType.APPLY)
2311        cross_apply = self._match_pair(TokenType.CROSS, TokenType.APPLY)
2312
2313        if outer_apply or cross_apply:
2314            this = self._parse_select(table=True)
2315            view = None
2316            outer = not cross_apply
2317        elif self._match(TokenType.LATERAL):
2318            this = self._parse_select(table=True)
2319            view = self._match(TokenType.VIEW)
2320            outer = self._match(TokenType.OUTER)
2321        else:
2322            return None
2323
2324        if not this:
2325            this = (
2326                self._parse_unnest()
2327                or self._parse_function()
2328                or self._parse_id_var(any_token=False)
2329            )
2330
2331            while self._match(TokenType.DOT):
2332                this = exp.Dot(
2333                    this=this,
2334                    expression=self._parse_function() or self._parse_id_var(any_token=False),
2335                )
2336
2337        if view:
2338            table = self._parse_id_var(any_token=False)
2339            columns = self._parse_csv(self._parse_id_var) if self._match(TokenType.ALIAS) else []
2340            table_alias: t.Optional[exp.TableAlias] = self.expression(
2341                exp.TableAlias, this=table, columns=columns
2342            )
2343        elif isinstance(this, exp.Subquery) and this.alias:
2344            # Ensures parity between the Subquery's and the Lateral's "alias" args
2345            table_alias = this.args["alias"].copy()
2346        else:
2347            table_alias = self._parse_table_alias()
2348
2349        return self.expression(exp.Lateral, this=this, view=view, outer=outer, alias=table_alias)
2350
2351    def _parse_join_parts(
2352        self,
2353    ) -> t.Tuple[t.Optional[Token], t.Optional[Token], t.Optional[Token]]:
2354        return (
2355            self._match_set(self.JOIN_METHODS) and self._prev,
2356            self._match_set(self.JOIN_SIDES) and self._prev,
2357            self._match_set(self.JOIN_KINDS) and self._prev,
2358        )
2359
2360    def _parse_join(
2361        self, skip_join_token: bool = False, parse_bracket: bool = False
2362    ) -> t.Optional[exp.Join]:
2363        if self._match(TokenType.COMMA):
2364            return self.expression(exp.Join, this=self._parse_table())
2365
2366        index = self._index
2367        method, side, kind = self._parse_join_parts()
2368        hint = self._prev.text if self._match_texts(self.JOIN_HINTS) else None
2369        join = self._match(TokenType.JOIN)
2370
2371        if not skip_join_token and not join:
2372            self._retreat(index)
2373            kind = None
2374            method = None
2375            side = None
2376
2377        outer_apply = self._match_pair(TokenType.OUTER, TokenType.APPLY, False)
2378        cross_apply = self._match_pair(TokenType.CROSS, TokenType.APPLY, False)
2379
2380        if not skip_join_token and not join and not outer_apply and not cross_apply:
2381            return None
2382
2383        if outer_apply:
2384            side = Token(TokenType.LEFT, "LEFT")
2385
2386        kwargs: t.Dict[str, t.Any] = {"this": self._parse_table(parse_bracket=parse_bracket)}
2387
2388        if method:
2389            kwargs["method"] = method.text
2390        if side:
2391            kwargs["side"] = side.text
2392        if kind:
2393            kwargs["kind"] = kind.text
2394        if hint:
2395            kwargs["hint"] = hint
2396
2397        if self._match(TokenType.ON):
2398            kwargs["on"] = self._parse_conjunction()
2399        elif self._match(TokenType.USING):
2400            kwargs["using"] = self._parse_wrapped_id_vars()
2401        elif not (kind and kind.token_type == TokenType.CROSS):
2402            index = self._index
2403            joins = self._parse_joins()
2404
2405            if joins and self._match(TokenType.ON):
2406                kwargs["on"] = self._parse_conjunction()
2407            elif joins and self._match(TokenType.USING):
2408                kwargs["using"] = self._parse_wrapped_id_vars()
2409            else:
2410                joins = None
2411                self._retreat(index)
2412
2413            kwargs["this"].set("joins", joins)
2414
2415        comments = [c for token in (method, side, kind) if token for c in token.comments]
2416        return self.expression(exp.Join, comments=comments, **kwargs)
2417
2418    def _parse_index(
2419        self,
2420        index: t.Optional[exp.Expression] = None,
2421    ) -> t.Optional[exp.Index]:
2422        if index:
2423            unique = None
2424            primary = None
2425            amp = None
2426
2427            self._match(TokenType.ON)
2428            self._match(TokenType.TABLE)  # hive
2429            table = self._parse_table_parts(schema=True)
2430        else:
2431            unique = self._match(TokenType.UNIQUE)
2432            primary = self._match_text_seq("PRIMARY")
2433            amp = self._match_text_seq("AMP")
2434
2435            if not self._match(TokenType.INDEX):
2436                return None
2437
2438            index = self._parse_id_var()
2439            table = None
2440
2441        using = self._parse_field() if self._match(TokenType.USING) else None
2442
2443        if self._match(TokenType.L_PAREN, advance=False):
2444            columns = self._parse_wrapped_csv(self._parse_ordered)
2445        else:
2446            columns = None
2447
2448        return self.expression(
2449            exp.Index,
2450            this=index,
2451            table=table,
2452            using=using,
2453            columns=columns,
2454            unique=unique,
2455            primary=primary,
2456            amp=amp,
2457            partition_by=self._parse_partition_by(),
2458        )
2459
2460    def _parse_table_hints(self) -> t.Optional[t.List[exp.Expression]]:
2461        hints: t.List[exp.Expression] = []
2462        if self._match_pair(TokenType.WITH, TokenType.L_PAREN):
2463            # https://learn.microsoft.com/en-us/sql/t-sql/queries/hints-transact-sql-table?view=sql-server-ver16
2464            hints.append(
2465                self.expression(
2466                    exp.WithTableHint,
2467                    expressions=self._parse_csv(
2468                        lambda: self._parse_function() or self._parse_var(any_token=True)
2469                    ),
2470                )
2471            )
2472            self._match_r_paren()
2473        else:
2474            # https://dev.mysql.com/doc/refman/8.0/en/index-hints.html
2475            while self._match_set(self.TABLE_INDEX_HINT_TOKENS):
2476                hint = exp.IndexTableHint(this=self._prev.text.upper())
2477
2478                self._match_texts({"INDEX", "KEY"})
2479                if self._match(TokenType.FOR):
2480                    hint.set("target", self._advance_any() and self._prev.text.upper())
2481
2482                hint.set("expressions", self._parse_wrapped_id_vars())
2483                hints.append(hint)
2484
2485        return hints or None
2486
2487    def _parse_table_part(self, schema: bool = False) -> t.Optional[exp.Expression]:
2488        return (
2489            (not schema and self._parse_function(optional_parens=False))
2490            or self._parse_id_var(any_token=False)
2491            or self._parse_string_as_identifier()
2492            or self._parse_placeholder()
2493        )
2494
2495    def _parse_table_parts(self, schema: bool = False) -> exp.Table:
2496        catalog = None
2497        db = None
2498        table = self._parse_table_part(schema=schema)
2499
2500        while self._match(TokenType.DOT):
2501            if catalog:
2502                # This allows nesting the table in arbitrarily many dot expressions if needed
2503                table = self.expression(
2504                    exp.Dot, this=table, expression=self._parse_table_part(schema=schema)
2505                )
2506            else:
2507                catalog = db
2508                db = table
2509                table = self._parse_table_part(schema=schema)
2510
2511        if not table:
2512            self.raise_error(f"Expected table name but got {self._curr}")
2513
2514        return self.expression(
2515            exp.Table, this=table, db=db, catalog=catalog, pivots=self._parse_pivots()
2516        )
2517
2518    def _parse_table(
2519        self,
2520        schema: bool = False,
2521        joins: bool = False,
2522        alias_tokens: t.Optional[t.Collection[TokenType]] = None,
2523        parse_bracket: bool = False,
2524    ) -> t.Optional[exp.Expression]:
2525        lateral = self._parse_lateral()
2526        if lateral:
2527            return lateral
2528
2529        unnest = self._parse_unnest()
2530        if unnest:
2531            return unnest
2532
2533        values = self._parse_derived_table_values()
2534        if values:
2535            return values
2536
2537        subquery = self._parse_select(table=True)
2538        if subquery:
2539            if not subquery.args.get("pivots"):
2540                subquery.set("pivots", self._parse_pivots())
2541            return subquery
2542
2543        bracket = parse_bracket and self._parse_bracket(None)
2544        bracket = self.expression(exp.Table, this=bracket) if bracket else None
2545        this: exp.Expression = bracket or self._parse_table_parts(schema=schema)
2546
2547        if schema:
2548            return self._parse_schema(this=this)
2549
2550        version = self._parse_version()
2551
2552        if version:
2553            this.set("version", version)
2554
2555        if self.ALIAS_POST_TABLESAMPLE:
2556            table_sample = self._parse_table_sample()
2557
2558        alias = self._parse_table_alias(alias_tokens=alias_tokens or self.TABLE_ALIAS_TOKENS)
2559        if alias:
2560            this.set("alias", alias)
2561
2562        this.set("hints", self._parse_table_hints())
2563
2564        if not this.args.get("pivots"):
2565            this.set("pivots", self._parse_pivots())
2566
2567        if not self.ALIAS_POST_TABLESAMPLE:
2568            table_sample = self._parse_table_sample()
2569
2570        if table_sample:
2571            table_sample.set("this", this)
2572            this = table_sample
2573
2574        if joins:
2575            for join in iter(self._parse_join, None):
2576                this.append("joins", join)
2577
2578        return this
2579
2580    def _parse_version(self) -> t.Optional[exp.Version]:
2581        if self._match(TokenType.TIMESTAMP_SNAPSHOT):
2582            this = "TIMESTAMP"
2583        elif self._match(TokenType.VERSION_SNAPSHOT):
2584            this = "VERSION"
2585        else:
2586            return None
2587
2588        if self._match_set((TokenType.FROM, TokenType.BETWEEN)):
2589            kind = self._prev.text.upper()
2590            start = self._parse_bitwise()
2591            self._match_texts(("TO", "AND"))
2592            end = self._parse_bitwise()
2593            expression: t.Optional[exp.Expression] = self.expression(
2594                exp.Tuple, expressions=[start, end]
2595            )
2596        elif self._match_text_seq("CONTAINED", "IN"):
2597            kind = "CONTAINED IN"
2598            expression = self.expression(
2599                exp.Tuple, expressions=self._parse_wrapped_csv(self._parse_bitwise)
2600            )
2601        elif self._match(TokenType.ALL):
2602            kind = "ALL"
2603            expression = None
2604        else:
2605            self._match_text_seq("AS", "OF")
2606            kind = "AS OF"
2607            expression = self._parse_type()
2608
2609        return self.expression(exp.Version, this=this, expression=expression, kind=kind)
2610
2611    def _parse_unnest(self, with_alias: bool = True) -> t.Optional[exp.Unnest]:
2612        if not self._match(TokenType.UNNEST):
2613            return None
2614
2615        expressions = self._parse_wrapped_csv(self._parse_type)
2616        ordinality = self._match_pair(TokenType.WITH, TokenType.ORDINALITY)
2617
2618        alias = self._parse_table_alias() if with_alias else None
2619
2620        if alias and self.UNNEST_COLUMN_ONLY:
2621            if alias.args.get("columns"):
2622                self.raise_error("Unexpected extra column alias in unnest.")
2623
2624            alias.set("columns", [alias.this])
2625            alias.set("this", None)
2626
2627        offset = None
2628        if self._match_pair(TokenType.WITH, TokenType.OFFSET):
2629            self._match(TokenType.ALIAS)
2630            offset = self._parse_id_var() or exp.to_identifier("offset")
2631
2632        return self.expression(
2633            exp.Unnest, expressions=expressions, ordinality=ordinality, alias=alias, offset=offset
2634        )
2635
2636    def _parse_derived_table_values(self) -> t.Optional[exp.Values]:
2637        is_derived = self._match_pair(TokenType.L_PAREN, TokenType.VALUES)
2638        if not is_derived and not self._match(TokenType.VALUES):
2639            return None
2640
2641        expressions = self._parse_csv(self._parse_value)
2642        alias = self._parse_table_alias()
2643
2644        if is_derived:
2645            self._match_r_paren()
2646
2647        return self.expression(
2648            exp.Values, expressions=expressions, alias=alias or self._parse_table_alias()
2649        )
2650
2651    def _parse_table_sample(self, as_modifier: bool = False) -> t.Optional[exp.TableSample]:
2652        if not self._match(TokenType.TABLE_SAMPLE) and not (
2653            as_modifier and self._match_text_seq("USING", "SAMPLE")
2654        ):
2655            return None
2656
2657        bucket_numerator = None
2658        bucket_denominator = None
2659        bucket_field = None
2660        percent = None
2661        rows = None
2662        size = None
2663        seed = None
2664
2665        kind = (
2666            self._prev.text if self._prev.token_type == TokenType.TABLE_SAMPLE else "USING SAMPLE"
2667        )
2668        method = self._parse_var(tokens=(TokenType.ROW,))
2669
2670        self._match(TokenType.L_PAREN)
2671
2672        num = self._parse_number()
2673
2674        if self._match_text_seq("BUCKET"):
2675            bucket_numerator = self._parse_number()
2676            self._match_text_seq("OUT", "OF")
2677            bucket_denominator = bucket_denominator = self._parse_number()
2678            self._match(TokenType.ON)
2679            bucket_field = self._parse_field()
2680        elif self._match_set((TokenType.PERCENT, TokenType.MOD)):
2681            percent = num
2682        elif self._match(TokenType.ROWS):
2683            rows = num
2684        else:
2685            size = num
2686
2687        self._match(TokenType.R_PAREN)
2688
2689        if self._match(TokenType.L_PAREN):
2690            method = self._parse_var()
2691            seed = self._match(TokenType.COMMA) and self._parse_number()
2692            self._match_r_paren()
2693        elif self._match_texts(("SEED", "REPEATABLE")):
2694            seed = self._parse_wrapped(self._parse_number)
2695
2696        return self.expression(
2697            exp.TableSample,
2698            method=method,
2699            bucket_numerator=bucket_numerator,
2700            bucket_denominator=bucket_denominator,
2701            bucket_field=bucket_field,
2702            percent=percent,
2703            rows=rows,
2704            size=size,
2705            seed=seed,
2706            kind=kind,
2707        )
2708
2709    def _parse_pivots(self) -> t.Optional[t.List[exp.Pivot]]:
2710        return list(iter(self._parse_pivot, None)) or None
2711
2712    def _parse_joins(self) -> t.Optional[t.List[exp.Join]]:
2713        return list(iter(self._parse_join, None)) or None
2714
2715    # https://duckdb.org/docs/sql/statements/pivot
2716    def _parse_simplified_pivot(self) -> exp.Pivot:
2717        def _parse_on() -> t.Optional[exp.Expression]:
2718            this = self._parse_bitwise()
2719            return self._parse_in(this) if self._match(TokenType.IN) else this
2720
2721        this = self._parse_table()
2722        expressions = self._match(TokenType.ON) and self._parse_csv(_parse_on)
2723        using = self._match(TokenType.USING) and self._parse_csv(
2724            lambda: self._parse_alias(self._parse_function())
2725        )
2726        group = self._parse_group()
2727        return self.expression(
2728            exp.Pivot, this=this, expressions=expressions, using=using, group=group
2729        )
2730
2731    def _parse_pivot(self) -> t.Optional[exp.Pivot]:
2732        index = self._index
2733        include_nulls = None
2734
2735        if self._match(TokenType.PIVOT):
2736            unpivot = False
2737        elif self._match(TokenType.UNPIVOT):
2738            unpivot = True
2739
2740            # https://docs.databricks.com/en/sql/language-manual/sql-ref-syntax-qry-select-unpivot.html#syntax
2741            if self._match_text_seq("INCLUDE", "NULLS"):
2742                include_nulls = True
2743            elif self._match_text_seq("EXCLUDE", "NULLS"):
2744                include_nulls = False
2745        else:
2746            return None
2747
2748        expressions = []
2749        field = None
2750
2751        if not self._match(TokenType.L_PAREN):
2752            self._retreat(index)
2753            return None
2754
2755        if unpivot:
2756            expressions = self._parse_csv(self._parse_column)
2757        else:
2758            expressions = self._parse_csv(lambda: self._parse_alias(self._parse_function()))
2759
2760        if not expressions:
2761            self.raise_error("Failed to parse PIVOT's aggregation list")
2762
2763        if not self._match(TokenType.FOR):
2764            self.raise_error("Expecting FOR")
2765
2766        value = self._parse_column()
2767
2768        if not self._match(TokenType.IN):
2769            self.raise_error("Expecting IN")
2770
2771        field = self._parse_in(value, alias=True)
2772
2773        self._match_r_paren()
2774
2775        pivot = self.expression(
2776            exp.Pivot,
2777            expressions=expressions,
2778            field=field,
2779            unpivot=unpivot,
2780            include_nulls=include_nulls,
2781        )
2782
2783        if not self._match_set((TokenType.PIVOT, TokenType.UNPIVOT), advance=False):
2784            pivot.set("alias", self._parse_table_alias())
2785
2786        if not unpivot:
2787            names = self._pivot_column_names(t.cast(t.List[exp.Expression], expressions))
2788
2789            columns: t.List[exp.Expression] = []
2790            for fld in pivot.args["field"].expressions:
2791                field_name = fld.sql() if self.IDENTIFY_PIVOT_STRINGS else fld.alias_or_name
2792                for name in names:
2793                    if self.PREFIXED_PIVOT_COLUMNS:
2794                        name = f"{name}_{field_name}" if name else field_name
2795                    else:
2796                        name = f"{field_name}_{name}" if name else field_name
2797
2798                    columns.append(exp.to_identifier(name))
2799
2800            pivot.set("columns", columns)
2801
2802        return pivot
2803
2804    def _pivot_column_names(self, aggregations: t.List[exp.Expression]) -> t.List[str]:
2805        return [agg.alias for agg in aggregations]
2806
2807    def _parse_where(self, skip_where_token: bool = False) -> t.Optional[exp.Where]:
2808        if not skip_where_token and not self._match(TokenType.WHERE):
2809            return None
2810
2811        return self.expression(
2812            exp.Where, comments=self._prev_comments, this=self._parse_conjunction()
2813        )
2814
2815    def _parse_group(self, skip_group_by_token: bool = False) -> t.Optional[exp.Group]:
2816        if not skip_group_by_token and not self._match(TokenType.GROUP_BY):
2817            return None
2818
2819        elements = defaultdict(list)
2820
2821        if self._match(TokenType.ALL):
2822            return self.expression(exp.Group, all=True)
2823
2824        while True:
2825            expressions = self._parse_csv(self._parse_conjunction)
2826            if expressions:
2827                elements["expressions"].extend(expressions)
2828
2829            grouping_sets = self._parse_grouping_sets()
2830            if grouping_sets:
2831                elements["grouping_sets"].extend(grouping_sets)
2832
2833            rollup = None
2834            cube = None
2835            totals = None
2836
2837            with_ = self._match(TokenType.WITH)
2838            if self._match(TokenType.ROLLUP):
2839                rollup = with_ or self._parse_wrapped_csv(self._parse_column)
2840                elements["rollup"].extend(ensure_list(rollup))
2841
2842            if self._match(TokenType.CUBE):
2843                cube = with_ or self._parse_wrapped_csv(self._parse_column)
2844                elements["cube"].extend(ensure_list(cube))
2845
2846            if self._match_text_seq("TOTALS"):
2847                totals = True
2848                elements["totals"] = True  # type: ignore
2849
2850            if not (grouping_sets or rollup or cube or totals):
2851                break
2852
2853        return self.expression(exp.Group, **elements)  # type: ignore
2854
2855    def _parse_grouping_sets(self) -> t.Optional[t.List[exp.Expression]]:
2856        if not self._match(TokenType.GROUPING_SETS):
2857            return None
2858
2859        return self._parse_wrapped_csv(self._parse_grouping_set)
2860
2861    def _parse_grouping_set(self) -> t.Optional[exp.Expression]:
2862        if self._match(TokenType.L_PAREN):
2863            grouping_set = self._parse_csv(self._parse_column)
2864            self._match_r_paren()
2865            return self.expression(exp.Tuple, expressions=grouping_set)
2866
2867        return self._parse_column()
2868
2869    def _parse_having(self, skip_having_token: bool = False) -> t.Optional[exp.Having]:
2870        if not skip_having_token and not self._match(TokenType.HAVING):
2871            return None
2872        return self.expression(exp.Having, this=self._parse_conjunction())
2873
2874    def _parse_qualify(self) -> t.Optional[exp.Qualify]:
2875        if not self._match(TokenType.QUALIFY):
2876            return None
2877        return self.expression(exp.Qualify, this=self._parse_conjunction())
2878
2879    def _parse_connect(self, skip_start_token: bool = False) -> t.Optional[exp.Connect]:
2880        if skip_start_token:
2881            start = None
2882        elif self._match(TokenType.START_WITH):
2883            start = self._parse_conjunction()
2884        else:
2885            return None
2886
2887        self._match(TokenType.CONNECT_BY)
2888        self.NO_PAREN_FUNCTION_PARSERS["PRIOR"] = lambda self: self.expression(
2889            exp.Prior, this=self._parse_bitwise()
2890        )
2891        connect = self._parse_conjunction()
2892        self.NO_PAREN_FUNCTION_PARSERS.pop("PRIOR")
2893        return self.expression(exp.Connect, start=start, connect=connect)
2894
2895    def _parse_order(
2896        self, this: t.Optional[exp.Expression] = None, skip_order_token: bool = False
2897    ) -> t.Optional[exp.Expression]:
2898        if not skip_order_token and not self._match(TokenType.ORDER_BY):
2899            return this
2900
2901        return self.expression(
2902            exp.Order, this=this, expressions=self._parse_csv(self._parse_ordered)
2903        )
2904
2905    def _parse_sort(self, exp_class: t.Type[E], token: TokenType) -> t.Optional[E]:
2906        if not self._match(token):
2907            return None
2908        return self.expression(exp_class, expressions=self._parse_csv(self._parse_ordered))
2909
2910    def _parse_ordered(self) -> exp.Ordered:
2911        this = self._parse_conjunction()
2912        self._match(TokenType.ASC)
2913
2914        is_desc = self._match(TokenType.DESC)
2915        is_nulls_first = self._match_text_seq("NULLS", "FIRST")
2916        is_nulls_last = self._match_text_seq("NULLS", "LAST")
2917        desc = is_desc or False
2918        asc = not desc
2919        nulls_first = is_nulls_first or False
2920        explicitly_null_ordered = is_nulls_first or is_nulls_last
2921
2922        if (
2923            not explicitly_null_ordered
2924            and (
2925                (asc and self.NULL_ORDERING == "nulls_are_small")
2926                or (desc and self.NULL_ORDERING != "nulls_are_small")
2927            )
2928            and self.NULL_ORDERING != "nulls_are_last"
2929        ):
2930            nulls_first = True
2931
2932        return self.expression(exp.Ordered, this=this, desc=desc, nulls_first=nulls_first)
2933
2934    def _parse_limit(
2935        self, this: t.Optional[exp.Expression] = None, top: bool = False
2936    ) -> t.Optional[exp.Expression]:
2937        if self._match(TokenType.TOP if top else TokenType.LIMIT):
2938            comments = self._prev_comments
2939            if top:
2940                limit_paren = self._match(TokenType.L_PAREN)
2941                expression = self._parse_number()
2942
2943                if limit_paren:
2944                    self._match_r_paren()
2945            else:
2946                expression = self._parse_term()
2947
2948            if self._match(TokenType.COMMA):
2949                offset = expression
2950                expression = self._parse_term()
2951            else:
2952                offset = None
2953
2954            limit_exp = self.expression(
2955                exp.Limit, this=this, expression=expression, offset=offset, comments=comments
2956            )
2957
2958            return limit_exp
2959
2960        if self._match(TokenType.FETCH):
2961            direction = self._match_set((TokenType.FIRST, TokenType.NEXT))
2962            direction = self._prev.text if direction else "FIRST"
2963
2964            count = self._parse_number()
2965            percent = self._match(TokenType.PERCENT)
2966
2967            self._match_set((TokenType.ROW, TokenType.ROWS))
2968
2969            only = self._match_text_seq("ONLY")
2970            with_ties = self._match_text_seq("WITH", "TIES")
2971
2972            if only and with_ties:
2973                self.raise_error("Cannot specify both ONLY and WITH TIES in FETCH clause")
2974
2975            return self.expression(
2976                exp.Fetch,
2977                direction=direction,
2978                count=count,
2979                percent=percent,
2980                with_ties=with_ties,
2981            )
2982
2983        return this
2984
2985    def _parse_offset(self, this: t.Optional[exp.Expression] = None) -> t.Optional[exp.Expression]:
2986        if not self._match(TokenType.OFFSET):
2987            return this
2988
2989        count = self._parse_term()
2990        self._match_set((TokenType.ROW, TokenType.ROWS))
2991        return self.expression(exp.Offset, this=this, expression=count)
2992
2993    def _parse_locks(self) -> t.List[exp.Lock]:
2994        locks = []
2995        while True:
2996            if self._match_text_seq("FOR", "UPDATE"):
2997                update = True
2998            elif self._match_text_seq("FOR", "SHARE") or self._match_text_seq(
2999                "LOCK", "IN", "SHARE", "MODE"
3000            ):
3001                update = False
3002            else:
3003                break
3004
3005            expressions = None
3006            if self._match_text_seq("OF"):
3007                expressions = self._parse_csv(lambda: self._parse_table(schema=True))
3008
3009            wait: t.Optional[bool | exp.Expression] = None
3010            if self._match_text_seq("NOWAIT"):
3011                wait = True
3012            elif self._match_text_seq("WAIT"):
3013                wait = self._parse_primary()
3014            elif self._match_text_seq("SKIP", "LOCKED"):
3015                wait = False
3016
3017            locks.append(
3018                self.expression(exp.Lock, update=update, expressions=expressions, wait=wait)
3019            )
3020
3021        return locks
3022
3023    def _parse_set_operations(self, this: t.Optional[exp.Expression]) -> t.Optional[exp.Expression]:
3024        if not self._match_set(self.SET_OPERATIONS):
3025            return this
3026
3027        token_type = self._prev.token_type
3028
3029        if token_type == TokenType.UNION:
3030            expression = exp.Union
3031        elif token_type == TokenType.EXCEPT:
3032            expression = exp.Except
3033        else:
3034            expression = exp.Intersect
3035
3036        return self.expression(
3037            expression,
3038            this=this,
3039            distinct=self._match(TokenType.DISTINCT) or not self._match(TokenType.ALL),
3040            by_name=self._match_text_seq("BY", "NAME"),
3041            expression=self._parse_set_operations(self._parse_select(nested=True)),
3042        )
3043
3044    def _parse_expression(self) -> t.Optional[exp.Expression]:
3045        return self._parse_alias(self._parse_conjunction())
3046
3047    def _parse_conjunction(self) -> t.Optional[exp.Expression]:
3048        return self._parse_tokens(self._parse_equality, self.CONJUNCTION)
3049
3050    def _parse_equality(self) -> t.Optional[exp.Expression]:
3051        return self._parse_tokens(self._parse_comparison, self.EQUALITY)
3052
3053    def _parse_comparison(self) -> t.Optional[exp.Expression]:
3054        return self._parse_tokens(self._parse_range, self.COMPARISON)
3055
3056    def _parse_range(self) -> t.Optional[exp.Expression]:
3057        this = self._parse_bitwise()
3058        negate = self._match(TokenType.NOT)
3059
3060        if self._match_set(self.RANGE_PARSERS):
3061            expression = self.RANGE_PARSERS[self._prev.token_type](self, this)
3062            if not expression:
3063                return this
3064
3065            this = expression
3066        elif self._match(TokenType.ISNULL):
3067            this = self.expression(exp.Is, this=this, expression=exp.Null())
3068
3069        # Postgres supports ISNULL and NOTNULL for conditions.
3070        # https://blog.andreiavram.ro/postgresql-null-composite-type/
3071        if self._match(TokenType.NOTNULL):
3072            this = self.expression(exp.Is, this=this, expression=exp.Null())
3073            this = self.expression(exp.Not, this=this)
3074
3075        if negate:
3076            this = self.expression(exp.Not, this=this)
3077
3078        if self._match(TokenType.IS):
3079            this = self._parse_is(this)
3080
3081        return this
3082
3083    def _parse_is(self, this: t.Optional[exp.Expression]) -> t.Optional[exp.Expression]:
3084        index = self._index - 1
3085        negate = self._match(TokenType.NOT)
3086
3087        if self._match_text_seq("DISTINCT", "FROM"):
3088            klass = exp.NullSafeEQ if negate else exp.NullSafeNEQ
3089            return self.expression(klass, this=this, expression=self._parse_expression())
3090
3091        expression = self._parse_null() or self._parse_boolean()
3092        if not expression:
3093            self._retreat(index)
3094            return None
3095
3096        this = self.expression(exp.Is, this=this, expression=expression)
3097        return self.expression(exp.Not, this=this) if negate else this
3098
3099    def _parse_in(self, this: t.Optional[exp.Expression], alias: bool = False) -> exp.In:
3100        unnest = self._parse_unnest(with_alias=False)
3101        if unnest:
3102            this = self.expression(exp.In, this=this, unnest=unnest)
3103        elif self._match(TokenType.L_PAREN):
3104            expressions = self._parse_csv(lambda: self._parse_select_or_expression(alias=alias))
3105
3106            if len(expressions) == 1 and isinstance(expressions[0], exp.Subqueryable):
3107                this = self.expression(exp.In, this=this, query=expressions[0])
3108            else:
3109                this = self.expression(exp.In, this=this, expressions=expressions)
3110
3111            self._match_r_paren(this)
3112        else:
3113            this = self.expression(exp.In, this=this, field=self._parse_field())
3114
3115        return this
3116
3117    def _parse_between(self, this: exp.Expression) -> exp.Between:
3118        low = self._parse_bitwise()
3119        self._match(TokenType.AND)
3120        high = self._parse_bitwise()
3121        return self.expression(exp.Between, this=this, low=low, high=high)
3122
3123    def _parse_escape(self, this: t.Optional[exp.Expression]) -> t.Optional[exp.Expression]:
3124        if not self._match(TokenType.ESCAPE):
3125            return this
3126        return self.expression(exp.Escape, this=this, expression=self._parse_string())
3127
3128    def _parse_interval(self) -> t.Optional[exp.Interval]:
3129        index = self._index
3130
3131        if not self._match(TokenType.INTERVAL):
3132            return None
3133
3134        if self._match(TokenType.STRING, advance=False):
3135            this = self._parse_primary()
3136        else:
3137            this = self._parse_term()
3138
3139        if not this:
3140            self._retreat(index)
3141            return None
3142
3143        unit = self._parse_function() or self._parse_var(any_token=True)
3144
3145        # Most dialects support, e.g., the form INTERVAL '5' day, thus we try to parse
3146        # each INTERVAL expression into this canonical form so it's easy to transpile
3147        if this and this.is_number:
3148            this = exp.Literal.string(this.name)
3149        elif this and this.is_string:
3150            parts = this.name.split()
3151
3152            if len(parts) == 2:
3153                if unit:
3154                    # this is not actually a unit, it's something else
3155                    unit = None
3156                    self._retreat(self._index - 1)
3157                else:
3158                    this = exp.Literal.string(parts[0])
3159                    unit = self.expression(exp.Var, this=parts[1])
3160
3161        return self.expression(exp.Interval, this=this, unit=unit)
3162
3163    def _parse_bitwise(self) -> t.Optional[exp.Expression]:
3164        this = self._parse_term()
3165
3166        while True:
3167            if self._match_set(self.BITWISE):
3168                this = self.expression(
3169                    self.BITWISE[self._prev.token_type],
3170                    this=this,
3171                    expression=self._parse_term(),
3172                )
3173            elif self._match(TokenType.DQMARK):
3174                this = self.expression(exp.Coalesce, this=this, expressions=self._parse_term())
3175            elif self._match_pair(TokenType.LT, TokenType.LT):
3176                this = self.expression(
3177                    exp.BitwiseLeftShift, this=this, expression=self._parse_term()
3178                )
3179            elif self._match_pair(TokenType.GT, TokenType.GT):
3180                this = self.expression(
3181                    exp.BitwiseRightShift, this=this, expression=self._parse_term()
3182                )
3183            else:
3184                break
3185
3186        return this
3187
3188    def _parse_term(self) -> t.Optional[exp.Expression]:
3189        return self._parse_tokens(self._parse_factor, self.TERM)
3190
3191    def _parse_factor(self) -> t.Optional[exp.Expression]:
3192        return self._parse_tokens(self._parse_unary, self.FACTOR)
3193
3194    def _parse_unary(self) -> t.Optional[exp.Expression]:
3195        if self._match_set(self.UNARY_PARSERS):
3196            return self.UNARY_PARSERS[self._prev.token_type](self)
3197        return self._parse_at_time_zone(self._parse_type())
3198
3199    def _parse_type(self) -> t.Optional[exp.Expression]:
3200        interval = self._parse_interval()
3201        if interval:
3202            return interval
3203
3204        index = self._index
3205        data_type = self._parse_types(check_func=True, allow_identifiers=False)
3206        this = self._parse_column()
3207
3208        if data_type:
3209            if isinstance(this, exp.Literal):
3210                parser = self.TYPE_LITERAL_PARSERS.get(data_type.this)
3211                if parser:
3212                    return parser(self, this, data_type)
3213                return self.expression(exp.Cast, this=this, to=data_type)
3214            if not data_type.expressions:
3215                self._retreat(index)
3216                return self._parse_column()
3217            return self._parse_column_ops(data_type)
3218
3219        return this
3220
3221    def _parse_type_size(self) -> t.Optional[exp.DataTypeParam]:
3222        this = self._parse_type()
3223        if not this:
3224            return None
3225
3226        return self.expression(
3227            exp.DataTypeParam, this=this, expression=self._parse_var(any_token=True)
3228        )
3229
3230    def _parse_types(
3231        self, check_func: bool = False, schema: bool = False, allow_identifiers: bool = True
3232    ) -> t.Optional[exp.Expression]:
3233        index = self._index
3234
3235        prefix = self._match_text_seq("SYSUDTLIB", ".")
3236
3237        if not self._match_set(self.TYPE_TOKENS):
3238            identifier = allow_identifiers and self._parse_id_var(
3239                any_token=False, tokens=(TokenType.VAR,)
3240            )
3241
3242            if identifier:
3243                tokens = self._tokenizer.tokenize(identifier.name)
3244
3245                if len(tokens) != 1:
3246                    self.raise_error("Unexpected identifier", self._prev)
3247
3248                if tokens[0].token_type in self.TYPE_TOKENS:
3249                    self._prev = tokens[0]
3250                elif self.SUPPORTS_USER_DEFINED_TYPES:
3251                    return identifier
3252                else:
3253                    return None
3254            else:
3255                return None
3256
3257        type_token = self._prev.token_type
3258
3259        if type_token == TokenType.PSEUDO_TYPE:
3260            return self.expression(exp.PseudoType, this=self._prev.text)
3261
3262        nested = type_token in self.NESTED_TYPE_TOKENS
3263        is_struct = type_token in self.STRUCT_TYPE_TOKENS
3264        expressions = None
3265        maybe_func = False
3266
3267        if self._match(TokenType.L_PAREN):
3268            if is_struct:
3269                expressions = self._parse_csv(self._parse_struct_types)
3270            elif nested:
3271                expressions = self._parse_csv(
3272                    lambda: self._parse_types(
3273                        check_func=check_func, schema=schema, allow_identifiers=allow_identifiers
3274                    )
3275                )
3276            elif type_token in self.ENUM_TYPE_TOKENS:
3277                expressions = self._parse_csv(self._parse_equality)
3278            else:
3279                expressions = self._parse_csv(self._parse_type_size)
3280
3281            if not expressions or not self._match(TokenType.R_PAREN):
3282                self._retreat(index)
3283                return None
3284
3285            maybe_func = True
3286
3287        this: t.Optional[exp.Expression] = None
3288        values: t.Optional[t.List[exp.Expression]] = None
3289
3290        if nested and self._match(TokenType.LT):
3291            if is_struct:
3292                expressions = self._parse_csv(self._parse_struct_types)
3293            else:
3294                expressions = self._parse_csv(
3295                    lambda: self._parse_types(
3296                        check_func=check_func, schema=schema, allow_identifiers=allow_identifiers
3297                    )
3298                )
3299
3300            if not self._match(TokenType.GT):
3301                self.raise_error("Expecting >")
3302
3303            if self._match_set((TokenType.L_BRACKET, TokenType.L_PAREN)):
3304                values = self._parse_csv(self._parse_conjunction)
3305                self._match_set((TokenType.R_BRACKET, TokenType.R_PAREN))
3306
3307        if type_token in self.TIMESTAMPS:
3308            if self._match_text_seq("WITH", "TIME", "ZONE"):
3309                maybe_func = False
3310                tz_type = (
3311                    exp.DataType.Type.TIMETZ
3312                    if type_token in self.TIMES
3313                    else exp.DataType.Type.TIMESTAMPTZ
3314                )
3315                this = exp.DataType(this=tz_type, expressions=expressions)
3316            elif self._match_text_seq("WITH", "LOCAL", "TIME", "ZONE"):
3317                maybe_func = False
3318                this = exp.DataType(this=exp.DataType.Type.TIMESTAMPLTZ, expressions=expressions)
3319            elif self._match_text_seq("WITHOUT", "TIME", "ZONE"):
3320                maybe_func = False
3321        elif type_token == TokenType.INTERVAL:
3322            if self._match_text_seq("YEAR", "TO", "MONTH"):
3323                span: t.Optional[t.List[exp.Expression]] = [exp.IntervalYearToMonthSpan()]
3324            elif self._match_text_seq("DAY", "TO", "SECOND"):
3325                span = [exp.IntervalDayToSecondSpan()]
3326            else:
3327                span = None
3328
3329            unit = not span and self._parse_var()
3330            if not unit:
3331                this = self.expression(
3332                    exp.DataType, this=exp.DataType.Type.INTERVAL, expressions=span
3333                )
3334            else:
3335                this = self.expression(exp.Interval, unit=unit)
3336
3337        if maybe_func and check_func:
3338            index2 = self._index
3339            peek = self._parse_string()
3340
3341            if not peek:
3342                self._retreat(index)
3343                return None
3344
3345            self._retreat(index2)
3346
3347        if not this:
3348            this = exp.DataType(
3349                this=exp.DataType.Type[type_token.value],
3350                expressions=expressions,
3351                nested=nested,
3352                values=values,
3353                prefix=prefix,
3354            )
3355
3356        while self._match_pair(TokenType.L_BRACKET, TokenType.R_BRACKET):
3357            this = exp.DataType(this=exp.DataType.Type.ARRAY, expressions=[this], nested=True)
3358
3359        return this
3360
3361    def _parse_struct_types(self) -> t.Optional[exp.Expression]:
3362        this = self._parse_type() or self._parse_id_var()
3363        self._match(TokenType.COLON)
3364        return self._parse_column_def(this)
3365
3366    def _parse_at_time_zone(self, this: t.Optional[exp.Expression]) -> t.Optional[exp.Expression]:
3367        if not self._match_text_seq("AT", "TIME", "ZONE"):
3368            return this
3369        return self.expression(exp.AtTimeZone, this=this, zone=self._parse_unary())
3370
3371    def _parse_column(self) -> t.Optional[exp.Expression]:
3372        this = self._parse_field()
3373        if isinstance(this, exp.Identifier):
3374            this = self.expression(exp.Column, this=this)
3375        elif not this:
3376            return self._parse_bracket(this)
3377        return self._parse_column_ops(this)
3378
3379    def _parse_column_ops(self, this: t.Optional[exp.Expression]) -> t.Optional[exp.Expression]:
3380        this = self._parse_bracket(this)
3381
3382        while self._match_set(self.COLUMN_OPERATORS):
3383            op_token = self._prev.token_type
3384            op = self.COLUMN_OPERATORS.get(op_token)
3385
3386            if op_token == TokenType.DCOLON:
3387                field = self._parse_types()
3388                if not field:
3389                    self.raise_error("Expected type")
3390            elif op and self._curr:
3391                self._advance()
3392                value = self._prev.text
3393                field = (
3394                    exp.Literal.number(value)
3395                    if self._prev.token_type == TokenType.NUMBER
3396                    else exp.Literal.string(value)
3397                )
3398            else:
3399                field = self._parse_field(anonymous_func=True, any_token=True)
3400
3401            if isinstance(field, exp.Func):
3402                # bigquery allows function calls like x.y.count(...)
3403                # SAFE.SUBSTR(...)
3404                # https://cloud.google.com/bigquery/docs/reference/standard-sql/functions-reference#function_call_rules
3405                this = self._replace_columns_with_dots(this)
3406
3407            if op:
3408                this = op(self, this, field)
3409            elif isinstance(this, exp.Column) and not this.args.get("catalog"):
3410                this = self.expression(
3411                    exp.Column,
3412                    this=field,
3413                    table=this.this,
3414                    db=this.args.get("table"),
3415                    catalog=this.args.get("db"),
3416                )
3417            else:
3418                this = self.expression(exp.Dot, this=this, expression=field)
3419            this = self._parse_bracket(this)
3420        return this
3421
3422    def _parse_primary(self) -> t.Optional[exp.Expression]:
3423        if self._match_set(self.PRIMARY_PARSERS):
3424            token_type = self._prev.token_type
3425            primary = self.PRIMARY_PARSERS[token_type](self, self._prev)
3426
3427            if token_type == TokenType.STRING:
3428                expressions = [primary]
3429                while self._match(TokenType.STRING):
3430                    expressions.append(exp.Literal.string(self._prev.text))
3431
3432                if len(expressions) > 1:
3433                    return self.expression(exp.Concat, expressions=expressions)
3434
3435            return primary
3436
3437        if self._match_pair(TokenType.DOT, TokenType.NUMBER):
3438            return exp.Literal.number(f"0.{self._prev.text}")
3439
3440        if self._match(TokenType.L_PAREN):
3441            comments = self._prev_comments
3442            query = self._parse_select()
3443
3444            if query:
3445                expressions = [query]
3446            else:
3447                expressions = self._parse_expressions()
3448
3449            this = self._parse_query_modifiers(seq_get(expressions, 0))
3450
3451            if isinstance(this, exp.Subqueryable):
3452                this = self._parse_set_operations(
3453                    self._parse_subquery(this=this, parse_alias=False)
3454                )
3455            elif len(expressions) > 1:
3456                this = self.expression(exp.Tuple, expressions=expressions)
3457            else:
3458                this = self.expression(exp.Paren, this=self._parse_set_operations(this))
3459
3460            if this:
3461                this.add_comments(comments)
3462
3463            self._match_r_paren(expression=this)
3464            return this
3465
3466        return None
3467
3468    def _parse_field(
3469        self,
3470        any_token: bool = False,
3471        tokens: t.Optional[t.Collection[TokenType]] = None,
3472        anonymous_func: bool = False,
3473    ) -> t.Optional[exp.Expression]:
3474        return (
3475            self._parse_primary()
3476            or self._parse_function(anonymous=anonymous_func)
3477            or self._parse_id_var(any_token=any_token, tokens=tokens)
3478        )
3479
3480    def _parse_function(
3481        self,
3482        functions: t.Optional[t.Dict[str, t.Callable]] = None,
3483        anonymous: bool = False,
3484        optional_parens: bool = True,
3485    ) -> t.Optional[exp.Expression]:
3486        if not self._curr:
3487            return None
3488
3489        token_type = self._curr.token_type
3490        this = self._curr.text
3491        upper = this.upper()
3492
3493        parser = self.NO_PAREN_FUNCTION_PARSERS.get(upper)
3494        if optional_parens and parser and token_type not in self.INVALID_FUNC_NAME_TOKENS:
3495            self._advance()
3496            return parser(self)
3497
3498        if not self._next or self._next.token_type != TokenType.L_PAREN:
3499            if optional_parens and token_type in self.NO_PAREN_FUNCTIONS:
3500                self._advance()
3501                return self.expression(self.NO_PAREN_FUNCTIONS[token_type])
3502
3503            return None
3504
3505        if token_type not in self.FUNC_TOKENS:
3506            return None
3507
3508        self._advance(2)
3509
3510        parser = self.FUNCTION_PARSERS.get(upper)
3511        if parser and not anonymous:
3512            this = parser(self)
3513        else:
3514            subquery_predicate = self.SUBQUERY_PREDICATES.get(token_type)
3515
3516            if subquery_predicate and self._curr.token_type in (TokenType.SELECT, TokenType.WITH):
3517                this = self.expression(subquery_predicate, this=self._parse_select())
3518                self._match_r_paren()
3519                return this
3520
3521            if functions is None:
3522                functions = self.FUNCTIONS
3523
3524            function = functions.get(upper)
3525
3526            alias = upper in self.FUNCTIONS_WITH_ALIASED_ARGS
3527            args = self._parse_csv(lambda: self._parse_lambda(alias=alias))
3528
3529            if function and not anonymous:
3530                func = self.validate_expression(function(args), args)
3531                if not self.NORMALIZE_FUNCTIONS:
3532                    func.meta["name"] = this
3533                this = func
3534            else:
3535                this = self.expression(exp.Anonymous, this=this, expressions=args)
3536
3537        self._match_r_paren(this)
3538        return self._parse_window(this)
3539
3540    def _parse_function_parameter(self) -> t.Optional[exp.Expression]:
3541        return self._parse_column_def(self._parse_id_var())
3542
3543    def _parse_user_defined_function(
3544        self, kind: t.Optional[TokenType] = None
3545    ) -> t.Optional[exp.Expression]:
3546        this = self._parse_id_var()
3547
3548        while self._match(TokenType.DOT):
3549            this = self.expression(exp.Dot, this=this, expression=self._parse_id_var())
3550
3551        if not self._match(TokenType.L_PAREN):
3552            return this
3553
3554        expressions = self._parse_csv(self._parse_function_parameter)
3555        self._match_r_paren()
3556        return self.expression(
3557            exp.UserDefinedFunction, this=this, expressions=expressions, wrapped=True
3558        )
3559
3560    def _parse_introducer(self, token: Token) -> exp.Introducer | exp.Identifier:
3561        literal = self._parse_primary()
3562        if literal:
3563            return self.expression(exp.Introducer, this=token.text, expression=literal)
3564
3565        return self.expression(exp.Identifier, this=token.text)
3566
3567    def _parse_session_parameter(self) -> exp.SessionParameter:
3568        kind = None
3569        this = self._parse_id_var() or self._parse_primary()
3570
3571        if this and self._match(TokenType.DOT):
3572            kind = this.name
3573            this = self._parse_var() or self._parse_primary()
3574
3575        return self.expression(exp.SessionParameter, this=this, kind=kind)
3576
3577    def _parse_lambda(self, alias: bool = False) -> t.Optional[exp.Expression]:
3578        index = self._index
3579
3580        if self._match(TokenType.L_PAREN):
3581            expressions = t.cast(
3582                t.List[t.Optional[exp.Expression]], self._parse_csv(self._parse_id_var)
3583            )
3584
3585            if not self._match(TokenType.R_PAREN):
3586                self._retreat(index)
3587        else:
3588            expressions = [self._parse_id_var()]
3589
3590        if self._match_set(self.LAMBDAS):
3591            return self.LAMBDAS[self._prev.token_type](self, expressions)
3592
3593        self._retreat(index)
3594
3595        this: t.Optional[exp.Expression]
3596
3597        if self._match(TokenType.DISTINCT):
3598            this = self.expression(
3599                exp.Distinct, expressions=self._parse_csv(self._parse_conjunction)
3600            )
3601        else:
3602            this = self._parse_select_or_expression(alias=alias)
3603
3604        return self._parse_limit(self._parse_order(self._parse_respect_or_ignore_nulls(this)))
3605
3606    def _parse_schema(self, this: t.Optional[exp.Expression] = None) -> t.Optional[exp.Expression]:
3607        index = self._index
3608
3609        if not self.errors:
3610            try:
3611                if self._parse_select(nested=True):
3612                    return this
3613            except ParseError:
3614                pass
3615            finally:
3616                self.errors.clear()
3617                self._retreat(index)
3618
3619        if not self._match(TokenType.L_PAREN):
3620            return this
3621
3622        args = self._parse_csv(lambda: self._parse_constraint() or self._parse_field_def())
3623
3624        self._match_r_paren()
3625        return self.expression(exp.Schema, this=this, expressions=args)
3626
3627    def _parse_field_def(self) -> t.Optional[exp.Expression]:
3628        return self._parse_column_def(self._parse_field(any_token=True))
3629
3630    def _parse_column_def(self, this: t.Optional[exp.Expression]) -> t.Optional[exp.Expression]:
3631        # column defs are not really columns, they're identifiers
3632        if isinstance(this, exp.Column):
3633            this = this.this
3634
3635        kind = self._parse_types(schema=True)
3636
3637        if self._match_text_seq("FOR", "ORDINALITY"):
3638            return self.expression(exp.ColumnDef, this=this, ordinality=True)
3639
3640        constraints: t.List[exp.Expression] = []
3641
3642        if not kind and self._match(TokenType.ALIAS):
3643            constraints.append(
3644                self.expression(
3645                    exp.ComputedColumnConstraint,
3646                    this=self._parse_conjunction(),
3647                    persisted=self._match_text_seq("PERSISTED"),
3648                    not_null=self._match_pair(TokenType.NOT, TokenType.NULL),
3649                )
3650            )
3651
3652        while True:
3653            constraint = self._parse_column_constraint()
3654            if not constraint:
3655                break
3656            constraints.append(constraint)
3657
3658        if not kind and not constraints:
3659            return this
3660
3661        return self.expression(exp.ColumnDef, this=this, kind=kind, constraints=constraints)
3662
3663    def _parse_auto_increment(
3664        self,
3665    ) -> exp.GeneratedAsIdentityColumnConstraint | exp.AutoIncrementColumnConstraint:
3666        start = None
3667        increment = None
3668
3669        if self._match(TokenType.L_PAREN, advance=False):
3670            args = self._parse_wrapped_csv(self._parse_bitwise)
3671            start = seq_get(args, 0)
3672            increment = seq_get(args, 1)
3673        elif self._match_text_seq("START"):
3674            start = self._parse_bitwise()
3675            self._match_text_seq("INCREMENT")
3676            increment = self._parse_bitwise()
3677
3678        if start and increment:
3679            return exp.GeneratedAsIdentityColumnConstraint(start=start, increment=increment)
3680
3681        return exp.AutoIncrementColumnConstraint()
3682
3683    def _parse_compress(self) -> exp.CompressColumnConstraint:
3684        if self._match(TokenType.L_PAREN, advance=False):
3685            return self.expression(
3686                exp.CompressColumnConstraint, this=self._parse_wrapped_csv(self._parse_bitwise)
3687            )
3688
3689        return self.expression(exp.CompressColumnConstraint, this=self._parse_bitwise())
3690
3691    def _parse_generated_as_identity(self) -> exp.GeneratedAsIdentityColumnConstraint:
3692        if self._match_text_seq("BY", "DEFAULT"):
3693            on_null = self._match_pair(TokenType.ON, TokenType.NULL)
3694            this = self.expression(
3695                exp.GeneratedAsIdentityColumnConstraint, this=False, on_null=on_null
3696            )
3697        else:
3698            self._match_text_seq("ALWAYS")
3699            this = self.expression(exp.GeneratedAsIdentityColumnConstraint, this=True)
3700
3701        self._match(TokenType.ALIAS)
3702        identity = self._match_text_seq("IDENTITY")
3703
3704        if self._match(TokenType.L_PAREN):
3705            if self._match(TokenType.START_WITH):
3706                this.set("start", self._parse_bitwise())
3707            if self._match_text_seq("INCREMENT", "BY"):
3708                this.set("increment", self._parse_bitwise())
3709            if self._match_text_seq("MINVALUE"):
3710                this.set("minvalue", self._parse_bitwise())
3711            if self._match_text_seq("MAXVALUE"):
3712                this.set("maxvalue", self._parse_bitwise())
3713
3714            if self._match_text_seq("CYCLE"):
3715                this.set("cycle", True)
3716            elif self._match_text_seq("NO", "CYCLE"):
3717                this.set("cycle", False)
3718
3719            if not identity:
3720                this.set("expression", self._parse_bitwise())
3721
3722            self._match_r_paren()
3723
3724        return this
3725
3726    def _parse_inline(self) -> exp.InlineLengthColumnConstraint:
3727        self._match_text_seq("LENGTH")
3728        return self.expression(exp.InlineLengthColumnConstraint, this=self._parse_bitwise())
3729
3730    def _parse_not_constraint(
3731        self,
3732    ) -> t.Optional[exp.Expression]:
3733        if self._match_text_seq("NULL"):
3734            return self.expression(exp.NotNullColumnConstraint)
3735        if self._match_text_seq("CASESPECIFIC"):
3736            return self.expression(exp.CaseSpecificColumnConstraint, not_=True)
3737        if self._match_text_seq("FOR", "REPLICATION"):
3738            return self.expression(exp.NotForReplicationColumnConstraint)
3739        return None
3740
3741    def _parse_column_constraint(self) -> t.Optional[exp.Expression]:
3742        if self._match(TokenType.CONSTRAINT):
3743            this = self._parse_id_var()
3744        else:
3745            this = None
3746
3747        if self._match_texts(self.CONSTRAINT_PARSERS):
3748            return self.expression(
3749                exp.ColumnConstraint,
3750                this=this,
3751                kind=self.CONSTRAINT_PARSERS[self._prev.text.upper()](self),
3752            )
3753
3754        return this
3755
3756    def _parse_constraint(self) -> t.Optional[exp.Expression]:
3757        if not self._match(TokenType.CONSTRAINT):
3758            return self._parse_unnamed_constraint(constraints=self.SCHEMA_UNNAMED_CONSTRAINTS)
3759
3760        this = self._parse_id_var()
3761        expressions = []
3762
3763        while True:
3764            constraint = self._parse_unnamed_constraint() or self._parse_function()
3765            if not constraint:
3766                break
3767            expressions.append(constraint)
3768
3769        return self.expression(exp.Constraint, this=this, expressions=expressions)
3770
3771    def _parse_unnamed_constraint(
3772        self, constraints: t.Optional[t.Collection[str]] = None
3773    ) -> t.Optional[exp.Expression]:
3774        if not self._match_texts(constraints or self.CONSTRAINT_PARSERS):
3775            return None
3776
3777        constraint = self._prev.text.upper()
3778        if constraint not in self.CONSTRAINT_PARSERS:
3779            self.raise_error(f"No parser found for schema constraint {constraint}.")
3780
3781        return self.CONSTRAINT_PARSERS[constraint](self)
3782
3783    def _parse_unique(self) -> exp.UniqueColumnConstraint:
3784        self._match_text_seq("KEY")
3785        return self.expression(
3786            exp.UniqueColumnConstraint, this=self._parse_schema(self._parse_id_var(any_token=False))
3787        )
3788
3789    def _parse_key_constraint_options(self) -> t.List[str]:
3790        options = []
3791        while True:
3792            if not self._curr:
3793                break
3794
3795            if self._match(TokenType.ON):
3796                action = None
3797                on = self._advance_any() and self._prev.text
3798
3799                if self._match_text_seq("NO", "ACTION"):
3800                    action = "NO ACTION"
3801                elif self._match_text_seq("CASCADE"):
3802                    action = "CASCADE"
3803                elif self._match_pair(TokenType.SET, TokenType.NULL):
3804                    action = "SET NULL"
3805                elif self._match_pair(TokenType.SET, TokenType.DEFAULT):
3806                    action = "SET DEFAULT"
3807                else:
3808                    self.raise_error("Invalid key constraint")
3809
3810                options.append(f"ON {on} {action}")
3811            elif self._match_text_seq("NOT", "ENFORCED"):
3812                options.append("NOT ENFORCED")
3813            elif self._match_text_seq("DEFERRABLE"):
3814                options.append("DEFERRABLE")
3815            elif self._match_text_seq("INITIALLY", "DEFERRED"):
3816                options.append("INITIALLY DEFERRED")
3817            elif self._match_text_seq("NORELY"):
3818                options.append("NORELY")
3819            elif self._match_text_seq("MATCH", "FULL"):
3820                options.append("MATCH FULL")
3821            else:
3822                break
3823
3824        return options
3825
3826    def _parse_references(self, match: bool = True) -> t.Optional[exp.Reference]:
3827        if match and not self._match(TokenType.REFERENCES):
3828            return None
3829
3830        expressions = None
3831        this = self._parse_table(schema=True)
3832        options = self._parse_key_constraint_options()
3833        return self.expression(exp.Reference, this=this, expressions=expressions, options=options)
3834
3835    def _parse_foreign_key(self) -> exp.ForeignKey:
3836        expressions = self._parse_wrapped_id_vars()
3837        reference = self._parse_references()
3838        options = {}
3839
3840        while self._match(TokenType.ON):
3841            if not self._match_set((TokenType.DELETE, TokenType.UPDATE)):
3842                self.raise_error("Expected DELETE or UPDATE")
3843
3844            kind = self._prev.text.lower()
3845
3846            if self._match_text_seq("NO", "ACTION"):
3847                action = "NO ACTION"
3848            elif self._match(TokenType.SET):
3849                self._match_set((TokenType.NULL, TokenType.DEFAULT))
3850                action = "SET " + self._prev.text.upper()
3851            else:
3852                self._advance()
3853                action = self._prev.text.upper()
3854
3855            options[kind] = action
3856
3857        return self.expression(
3858            exp.ForeignKey, expressions=expressions, reference=reference, **options  # type: ignore
3859        )
3860
3861    def _parse_primary_key(
3862        self, wrapped_optional: bool = False, in_props: bool = False
3863    ) -> exp.PrimaryKeyColumnConstraint | exp.PrimaryKey:
3864        desc = (
3865            self._match_set((TokenType.ASC, TokenType.DESC))
3866            and self._prev.token_type == TokenType.DESC
3867        )
3868
3869        if not in_props and not self._match(TokenType.L_PAREN, advance=False):
3870            return self.expression(exp.PrimaryKeyColumnConstraint, desc=desc)
3871
3872        expressions = self._parse_wrapped_csv(self._parse_field, optional=wrapped_optional)
3873        options = self._parse_key_constraint_options()
3874        return self.expression(exp.PrimaryKey, expressions=expressions, options=options)
3875
3876    def _parse_bracket(self, this: t.Optional[exp.Expression]) -> t.Optional[exp.Expression]:
3877        if not self._match_set((TokenType.L_BRACKET, TokenType.L_BRACE)):
3878            return this
3879
3880        bracket_kind = self._prev.token_type
3881
3882        if self._match(TokenType.COLON):
3883            expressions: t.List[exp.Expression] = [
3884                self.expression(exp.Slice, expression=self._parse_conjunction())
3885            ]
3886        else:
3887            expressions = self._parse_csv(
3888                lambda: self._parse_slice(
3889                    self._parse_alias(self._parse_conjunction(), explicit=True)
3890                )
3891            )
3892
3893        # https://duckdb.org/docs/sql/data_types/struct.html#creating-structs
3894        if bracket_kind == TokenType.L_BRACE:
3895            this = self.expression(exp.Struct, expressions=expressions)
3896        elif not this or this.name.upper() == "ARRAY":
3897            this = self.expression(exp.Array, expressions=expressions)
3898        else:
3899            expressions = apply_index_offset(this, expressions, -self.INDEX_OFFSET)
3900            this = self.expression(exp.Bracket, this=this, expressions=expressions)
3901
3902        if not self._match(TokenType.R_BRACKET) and bracket_kind == TokenType.L_BRACKET:
3903            self.raise_error("Expected ]")
3904        elif not self._match(TokenType.R_BRACE) and bracket_kind == TokenType.L_BRACE:
3905            self.raise_error("Expected }")
3906
3907        self._add_comments(this)
3908        return self._parse_bracket(this)
3909
3910    def _parse_slice(self, this: t.Optional[exp.Expression]) -> t.Optional[exp.Expression]:
3911        if self._match(TokenType.COLON):
3912            return self.expression(exp.Slice, this=this, expression=self._parse_conjunction())
3913        return this
3914
3915    def _parse_case(self) -> t.Optional[exp.Expression]:
3916        ifs = []
3917        default = None
3918
3919        comments = self._prev_comments
3920        expression = self._parse_conjunction()
3921
3922        while self._match(TokenType.WHEN):
3923            this = self._parse_conjunction()
3924            self._match(TokenType.THEN)
3925            then = self._parse_conjunction()
3926            ifs.append(self.expression(exp.If, this=this, true=then))
3927
3928        if self._match(TokenType.ELSE):
3929            default = self._parse_conjunction()
3930
3931        if not self._match(TokenType.END):
3932            self.raise_error("Expected END after CASE", self._prev)
3933
3934        return self._parse_window(
3935            self.expression(exp.Case, comments=comments, this=expression, ifs=ifs, default=default)
3936        )
3937
3938    def _parse_if(self) -> t.Optional[exp.Expression]:
3939        if self._match(TokenType.L_PAREN):
3940            args = self._parse_csv(self._parse_conjunction)
3941            this = self.validate_expression(exp.If.from_arg_list(args), args)
3942            self._match_r_paren()
3943        else:
3944            index = self._index - 1
3945            condition = self._parse_conjunction()
3946
3947            if not condition:
3948                self._retreat(index)
3949                return None
3950
3951            self._match(TokenType.THEN)
3952            true = self._parse_conjunction()
3953            false = self._parse_conjunction() if self._match(TokenType.ELSE) else None
3954            self._match(TokenType.END)
3955            this = self.expression(exp.If, this=condition, true=true, false=false)
3956
3957        return self._parse_window(this)
3958
3959    def _parse_next_value_for(self) -> t.Optional[exp.Expression]:
3960        if not self._match_text_seq("VALUE", "FOR"):
3961            self._retreat(self._index - 1)
3962            return None
3963
3964        return self.expression(
3965            exp.NextValueFor,
3966            this=self._parse_column(),
3967            order=self._match(TokenType.OVER) and self._parse_wrapped(self._parse_order),
3968        )
3969
3970    def _parse_extract(self) -> exp.Extract:
3971        this = self._parse_function() or self._parse_var() or self._parse_type()
3972
3973        if self._match(TokenType.FROM):
3974            return self.expression(exp.Extract, this=this, expression=self._parse_bitwise())
3975
3976        if not self._match(TokenType.COMMA):
3977            self.raise_error("Expected FROM or comma after EXTRACT", self._prev)
3978
3979        return self.expression(exp.Extract, this=this, expression=self._parse_bitwise())
3980
3981    def _parse_any_value(self) -> exp.AnyValue:
3982        this = self._parse_lambda()
3983        is_max = None
3984        having = None
3985
3986        if self._match(TokenType.HAVING):
3987            self._match_texts(("MAX", "MIN"))
3988            is_max = self._prev.text == "MAX"
3989            having = self._parse_column()
3990
3991        return self.expression(exp.AnyValue, this=this, having=having, max=is_max)
3992
3993    def _parse_cast(self, strict: bool) -> exp.Expression:
3994        this = self._parse_conjunction()
3995
3996        if not self._match(TokenType.ALIAS):
3997            if self._match(TokenType.COMMA):
3998                return self.expression(exp.CastToStrType, this=this, to=self._parse_string())
3999
4000            self.raise_error("Expected AS after CAST")
4001
4002        fmt = None
4003        to = self._parse_types()
4004
4005        if not to:
4006            self.raise_error("Expected TYPE after CAST")
4007        elif isinstance(to, exp.Identifier):
4008            to = exp.DataType.build(to.name, udt=True)
4009        elif to.this == exp.DataType.Type.CHAR:
4010            if self._match(TokenType.CHARACTER_SET):
4011                to = self.expression(exp.CharacterSet, this=self._parse_var_or_string())
4012        elif self._match(TokenType.FORMAT):
4013            fmt_string = self._parse_string()
4014            fmt = self._parse_at_time_zone(fmt_string)
4015
4016            if to.this in exp.DataType.TEMPORAL_TYPES:
4017                this = self.expression(
4018                    exp.StrToDate if to.this == exp.DataType.Type.DATE else exp.StrToTime,
4019                    this=this,
4020                    format=exp.Literal.string(
4021                        format_time(
4022                            fmt_string.this if fmt_string else "",
4023                            self.FORMAT_MAPPING or self.TIME_MAPPING,
4024                            self.FORMAT_TRIE or self.TIME_TRIE,
4025                        )
4026                    ),
4027                )
4028
4029                if isinstance(fmt, exp.AtTimeZone) and isinstance(this, exp.StrToTime):
4030                    this.set("zone", fmt.args["zone"])
4031
4032                return this
4033
4034        return self.expression(exp.Cast if strict else exp.TryCast, this=this, to=to, format=fmt)
4035
4036    def _parse_concat(self) -> t.Optional[exp.Expression]:
4037        args = self._parse_csv(self._parse_conjunction)
4038        if self.CONCAT_NULL_OUTPUTS_STRING:
4039            args = [
4040                exp.func("COALESCE", exp.cast(arg, "text"), exp.Literal.string(""))
4041                for arg in args
4042                if arg
4043            ]
4044
4045        # Some dialects (e.g. Trino) don't allow a single-argument CONCAT call, so when
4046        # we find such a call we replace it with its argument.
4047        if len(args) == 1:
4048            return args[0]
4049
4050        return self.expression(
4051            exp.Concat if self.STRICT_STRING_CONCAT else exp.SafeConcat, expressions=args
4052        )
4053
4054    def _parse_string_agg(self) -> exp.Expression:
4055        if self._match(TokenType.DISTINCT):
4056            args: t.List[t.Optional[exp.Expression]] = [
4057                self.expression(exp.Distinct, expressions=[self._parse_conjunction()])
4058            ]
4059            if self._match(TokenType.COMMA):
4060                args.extend(self._parse_csv(self._parse_conjunction))
4061        else:
4062            args = self._parse_csv(self._parse_conjunction)  # type: ignore
4063
4064        index = self._index
4065        if not self._match(TokenType.R_PAREN) and args:
4066            # postgres: STRING_AGG([DISTINCT] expression, separator [ORDER BY expression1 {ASC | DESC} [, ...]])
4067            # bigquery: STRING_AGG([DISTINCT] expression [, separator] [ORDER BY key [{ASC | DESC}] [, ... ]] [LIMIT n])
4068            args[-1] = self._parse_limit(this=self._parse_order(this=args[-1]))
4069            return self.expression(exp.GroupConcat, this=args[0], separator=seq_get(args, 1))
4070
4071        # Checks if we can parse an order clause: WITHIN GROUP (ORDER BY <order_by_expression_list> [ASC | DESC]).
4072        # This is done "manually", instead of letting _parse_window parse it into an exp.WithinGroup node, so that
4073        # the STRING_AGG call is parsed like in MySQL / SQLite and can thus be transpiled more easily to them.
4074        if not self._match_text_seq("WITHIN", "GROUP"):
4075            self._retreat(index)
4076            return self.validate_expression(exp.GroupConcat.from_arg_list(args), args)
4077
4078        self._match_l_paren()  # The corresponding match_r_paren will be called in parse_function (caller)
4079        order = self._parse_order(this=seq_get(args, 0))
4080        return self.expression(exp.GroupConcat, this=order, separator=seq_get(args, 1))
4081
4082    def _parse_convert(self, strict: bool) -> t.Optional[exp.Expression]:
4083        this = self._parse_bitwise()
4084
4085        if self._match(TokenType.USING):
4086            to: t.Optional[exp.Expression] = self.expression(
4087                exp.CharacterSet, this=self._parse_var()
4088            )
4089        elif self._match(TokenType.COMMA):
4090            to = self._parse_types()
4091        else:
4092            to = None
4093
4094        return self.expression(exp.Cast if strict else exp.TryCast, this=this, to=to)
4095
4096    def _parse_decode(self) -> t.Optional[exp.Decode | exp.Case]:
4097        """
4098        There are generally two variants of the DECODE function:
4099
4100        - DECODE(bin, charset)
4101        - DECODE(expression, search, result [, search, result] ... [, default])
4102
4103        The second variant will always be parsed into a CASE expression. Note that NULL
4104        needs special treatment, since we need to explicitly check for it with `IS NULL`,
4105        instead of relying on pattern matching.
4106        """
4107        args = self._parse_csv(self._parse_conjunction)
4108
4109        if len(args) < 3:
4110            return self.expression(exp.Decode, this=seq_get(args, 0), charset=seq_get(args, 1))
4111
4112        expression, *expressions = args
4113        if not expression:
4114            return None
4115
4116        ifs = []
4117        for search, result in zip(expressions[::2], expressions[1::2]):
4118            if not search or not result:
4119                return None
4120
4121            if isinstance(search, exp.Literal):
4122                ifs.append(
4123                    exp.If(this=exp.EQ(this=expression.copy(), expression=search), true=result)
4124                )
4125            elif isinstance(search, exp.Null):
4126                ifs.append(
4127                    exp.If(this=exp.Is(this=expression.copy(), expression=exp.Null()), true=result)
4128                )
4129            else:
4130                cond = exp.or_(
4131                    exp.EQ(this=expression.copy(), expression=search),
4132                    exp.and_(
4133                        exp.Is(this=expression.copy(), expression=exp.Null()),
4134                        exp.Is(this=search.copy(), expression=exp.Null()),
4135                        copy=False,
4136                    ),
4137                    copy=False,
4138                )
4139                ifs.append(exp.If(this=cond, true=result))
4140
4141        return exp.Case(ifs=ifs, default=expressions[-1] if len(expressions) % 2 == 1 else None)
4142
4143    def _parse_json_key_value(self) -> t.Optional[exp.JSONKeyValue]:
4144        self._match_text_seq("KEY")
4145        key = self._parse_field()
4146        self._match_set((TokenType.COLON, TokenType.COMMA))
4147        self._match_text_seq("VALUE")
4148        value = self._parse_column()
4149
4150        if not key and not value:
4151            return None
4152        return self.expression(exp.JSONKeyValue, this=key, expression=value)
4153
4154    def _parse_json_object(self) -> exp.JSONObject:
4155        star = self._parse_star()
4156        expressions = [star] if star else self._parse_csv(self._parse_json_key_value)
4157
4158        null_handling = None
4159        if self._match_text_seq("NULL", "ON", "NULL"):
4160            null_handling = "NULL ON NULL"
4161        elif self._match_text_seq("ABSENT", "ON", "NULL"):
4162            null_handling = "ABSENT ON NULL"
4163
4164        unique_keys = None
4165        if self._match_text_seq("WITH", "UNIQUE"):
4166            unique_keys = True
4167        elif self._match_text_seq("WITHOUT", "UNIQUE"):
4168            unique_keys = False
4169
4170        self._match_text_seq("KEYS")
4171
4172        return_type = self._match_text_seq("RETURNING") and self._parse_type()
4173        format_json = self._match_text_seq("FORMAT", "JSON")
4174        encoding = self._match_text_seq("ENCODING") and self._parse_var()
4175
4176        return self.expression(
4177            exp.JSONObject,
4178            expressions=expressions,
4179            null_handling=null_handling,
4180            unique_keys=unique_keys,
4181            return_type=return_type,
4182            format_json=format_json,
4183            encoding=encoding,
4184        )
4185
4186    def _parse_logarithm(self) -> exp.Func:
4187        # Default argument order is base, expression
4188        args = self._parse_csv(self._parse_range)
4189
4190        if len(args) > 1:
4191            if not self.LOG_BASE_FIRST:
4192                args.reverse()
4193            return exp.Log.from_arg_list(args)
4194
4195        return self.expression(
4196            exp.Ln if self.LOG_DEFAULTS_TO_LN else exp.Log, this=seq_get(args, 0)
4197        )
4198
4199    def _parse_match_against(self) -> exp.MatchAgainst:
4200        expressions = self._parse_csv(self._parse_column)
4201
4202        self._match_text_seq(")", "AGAINST", "(")
4203
4204        this = self._parse_string()
4205
4206        if self._match_text_seq("IN", "NATURAL", "LANGUAGE", "MODE"):
4207            modifier = "IN NATURAL LANGUAGE MODE"
4208            if self._match_text_seq("WITH", "QUERY", "EXPANSION"):
4209                modifier = f"{modifier} WITH QUERY EXPANSION"
4210        elif self._match_text_seq("IN", "BOOLEAN", "MODE"):
4211            modifier = "IN BOOLEAN MODE"
4212        elif self._match_text_seq("WITH", "QUERY", "EXPANSION"):
4213            modifier = "WITH QUERY EXPANSION"
4214        else:
4215            modifier = None
4216
4217        return self.expression(
4218            exp.MatchAgainst, this=this, expressions=expressions, modifier=modifier
4219        )
4220
4221    # https://learn.microsoft.com/en-us/sql/t-sql/functions/openjson-transact-sql?view=sql-server-ver16
4222    def _parse_open_json(self) -> exp.OpenJSON:
4223        this = self._parse_bitwise()
4224        path = self._match(TokenType.COMMA) and self._parse_string()
4225
4226        def _parse_open_json_column_def() -> exp.OpenJSONColumnDef:
4227            this = self._parse_field(any_token=True)
4228            kind = self._parse_types()
4229            path = self._parse_string()
4230            as_json = self._match_pair(TokenType.ALIAS, TokenType.JSON)
4231
4232            return self.expression(
4233                exp.OpenJSONColumnDef, this=this, kind=kind, path=path, as_json=as_json
4234            )
4235
4236        expressions = None
4237        if self._match_pair(TokenType.R_PAREN, TokenType.WITH):
4238            self._match_l_paren()
4239            expressions = self._parse_csv(_parse_open_json_column_def)
4240
4241        return self.expression(exp.OpenJSON, this=this, path=path, expressions=expressions)
4242
4243    def _parse_position(self, haystack_first: bool = False) -> exp.StrPosition:
4244        args = self._parse_csv(self._parse_bitwise)
4245
4246        if self._match(TokenType.IN):
4247            return self.expression(
4248                exp.StrPosition, this=self._parse_bitwise(), substr=seq_get(args, 0)
4249            )
4250
4251        if haystack_first:
4252            haystack = seq_get(args, 0)
4253            needle = seq_get(args, 1)
4254        else:
4255            needle = seq_get(args, 0)
4256            haystack = seq_get(args, 1)
4257
4258        return self.expression(
4259            exp.StrPosition, this=haystack, substr=needle, position=seq_get(args, 2)
4260        )
4261
4262    def _parse_join_hint(self, func_name: str) -> exp.JoinHint:
4263        args = self._parse_csv(self._parse_table)
4264        return exp.JoinHint(this=func_name.upper(), expressions=args)
4265
4266    def _parse_substring(self) -> exp.Substring:
4267        # Postgres supports the form: substring(string [from int] [for int])
4268        # https://www.postgresql.org/docs/9.1/functions-string.html @ Table 9-6
4269
4270        args = t.cast(t.List[t.Optional[exp.Expression]], self._parse_csv(self._parse_bitwise))
4271
4272        if self._match(TokenType.FROM):
4273            args.append(self._parse_bitwise())
4274            if self._match(TokenType.FOR):
4275                args.append(self._parse_bitwise())
4276
4277        return self.validate_expression(exp.Substring.from_arg_list(args), args)
4278
4279    def _parse_trim(self) -> exp.Trim:
4280        # https://www.w3resource.com/sql/character-functions/trim.php
4281        # https://docs.oracle.com/javadb/10.8.3.0/ref/rreftrimfunc.html
4282
4283        position = None
4284        collation = None
4285
4286        if self._match_texts(self.TRIM_TYPES):
4287            position = self._prev.text.upper()
4288
4289        expression = self._parse_bitwise()
4290        if self._match_set((TokenType.FROM, TokenType.COMMA)):
4291            this = self._parse_bitwise()
4292        else:
4293            this = expression
4294            expression = None
4295
4296        if self._match(TokenType.COLLATE):
4297            collation = self._parse_bitwise()
4298
4299        return self.expression(
4300            exp.Trim, this=this, position=position, expression=expression, collation=collation
4301        )
4302
4303    def _parse_window_clause(self) -> t.Optional[t.List[exp.Expression]]:
4304        return self._match(TokenType.WINDOW) and self._parse_csv(self._parse_named_window)
4305
4306    def _parse_named_window(self) -> t.Optional[exp.Expression]:
4307        return self._parse_window(self._parse_id_var(), alias=True)
4308
4309    def _parse_respect_or_ignore_nulls(
4310        self, this: t.Optional[exp.Expression]
4311    ) -> t.Optional[exp.Expression]:
4312        if self._match_text_seq("IGNORE", "NULLS"):
4313            return self.expression(exp.IgnoreNulls, this=this)
4314        if self._match_text_seq("RESPECT", "NULLS"):
4315            return self.expression(exp.RespectNulls, this=this)
4316        return this
4317
4318    def _parse_window(
4319        self, this: t.Optional[exp.Expression], alias: bool = False
4320    ) -> t.Optional[exp.Expression]:
4321        if self._match_pair(TokenType.FILTER, TokenType.L_PAREN):
4322            self._match(TokenType.WHERE)
4323            this = self.expression(
4324                exp.Filter, this=this, expression=self._parse_where(skip_where_token=True)
4325            )
4326            self._match_r_paren()
4327
4328        # T-SQL allows the OVER (...) syntax after WITHIN GROUP.
4329        # https://learn.microsoft.com/en-us/sql/t-sql/functions/percentile-disc-transact-sql?view=sql-server-ver16
4330        if self._match_text_seq("WITHIN", "GROUP"):
4331            order = self._parse_wrapped(self._parse_order)
4332            this = self.expression(exp.WithinGroup, this=this, expression=order)
4333
4334        # SQL spec defines an optional [ { IGNORE | RESPECT } NULLS ] OVER
4335        # Some dialects choose to implement and some do not.
4336        # https://dev.mysql.com/doc/refman/8.0/en/window-function-descriptions.html
4337
4338        # There is some code above in _parse_lambda that handles
4339        #   SELECT FIRST_VALUE(TABLE.COLUMN IGNORE|RESPECT NULLS) OVER ...
4340
4341        # The below changes handle
4342        #   SELECT FIRST_VALUE(TABLE.COLUMN) IGNORE|RESPECT NULLS OVER ...
4343
4344        # Oracle allows both formats
4345        #   (https://docs.oracle.com/en/database/oracle/oracle-database/19/sqlrf/img_text/first_value.html)
4346        #   and Snowflake chose to do the same for familiarity
4347        #   https://docs.snowflake.com/en/sql-reference/functions/first_value.html#usage-notes
4348        this = self._parse_respect_or_ignore_nulls(this)
4349
4350        # bigquery select from window x AS (partition by ...)
4351        if alias:
4352            over = None
4353            self._match(TokenType.ALIAS)
4354        elif not self._match_set(self.WINDOW_BEFORE_PAREN_TOKENS):
4355            return this
4356        else:
4357            over = self._prev.text.upper()
4358
4359        if not self._match(TokenType.L_PAREN):
4360            return self.expression(
4361                exp.Window, this=this, alias=self._parse_id_var(False), over=over
4362            )
4363
4364        window_alias = self._parse_id_var(any_token=False, tokens=self.WINDOW_ALIAS_TOKENS)
4365
4366        first = self._match(TokenType.FIRST)
4367        if self._match_text_seq("LAST"):
4368            first = False
4369
4370        partition, order = self._parse_partition_and_order()
4371        kind = self._match_set((TokenType.ROWS, TokenType.RANGE)) and self._prev.text
4372
4373        if kind:
4374            self._match(TokenType.BETWEEN)
4375            start = self._parse_window_spec()
4376            self._match(TokenType.AND)
4377            end = self._parse_window_spec()
4378
4379            spec = self.expression(
4380                exp.WindowSpec,
4381                kind=kind,
4382                start=start["value"],
4383                start_side=start["side"],
4384                end=end["value"],
4385                end_side=end["side"],
4386            )
4387        else:
4388            spec = None
4389
4390        self._match_r_paren()
4391
4392        window = self.expression(
4393            exp.Window,
4394            this=this,
4395            partition_by=partition,
4396            order=order,
4397            spec=spec,
4398            alias=window_alias,
4399            over=over,
4400            first=first,
4401        )
4402
4403        # This covers Oracle's FIRST/LAST syntax: aggregate KEEP (...) OVER (...)
4404        if self._match_set(self.WINDOW_BEFORE_PAREN_TOKENS, advance=False):
4405            return self._parse_window(window, alias=alias)
4406
4407        return window
4408
4409    def _parse_partition_and_order(
4410        self,
4411    ) -> t.Tuple[t.List[exp.Expression], t.Optional[exp.Expression]]:
4412        return self._parse_partition_by(), self._parse_order()
4413
4414    def _parse_window_spec(self) -> t.Dict[str, t.Optional[str | exp.Expression]]:
4415        self._match(TokenType.BETWEEN)
4416
4417        return {
4418            "value": (
4419                (self._match_text_seq("UNBOUNDED") and "UNBOUNDED")
4420                or (self._match_text_seq("CURRENT", "ROW") and "CURRENT ROW")
4421                or self._parse_bitwise()
4422            ),
4423            "side": self._match_texts(self.WINDOW_SIDES) and self._prev.text,
4424        }
4425
4426    def _parse_alias(
4427        self, this: t.Optional[exp.Expression], explicit: bool = False
4428    ) -> t.Optional[exp.Expression]:
4429        any_token = self._match(TokenType.ALIAS)
4430
4431        if explicit and not any_token:
4432            return this
4433
4434        if self._match(TokenType.L_PAREN):
4435            aliases = self.expression(
4436                exp.Aliases,
4437                this=this,
4438                expressions=self._parse_csv(lambda: self._parse_id_var(any_token)),
4439            )
4440            self._match_r_paren(aliases)
4441            return aliases
4442
4443        alias = self._parse_id_var(any_token)
4444
4445        if alias:
4446            return self.expression(exp.Alias, this=this, alias=alias)
4447
4448        return this
4449
4450    def _parse_id_var(
4451        self,
4452        any_token: bool = True,
4453        tokens: t.Optional[t.Collection[TokenType]] = None,
4454    ) -> t.Optional[exp.Expression]:
4455        identifier = self._parse_identifier()
4456
4457        if identifier:
4458            return identifier
4459
4460        if (any_token and self._advance_any()) or self._match_set(tokens or self.ID_VAR_TOKENS):
4461            quoted = self._prev.token_type == TokenType.STRING
4462            return exp.Identifier(this=self._prev.text, quoted=quoted)
4463
4464        return None
4465
4466    def _parse_string(self) -> t.Optional[exp.Expression]:
4467        if self._match(TokenType.STRING):
4468            return self.PRIMARY_PARSERS[TokenType.STRING](self, self._prev)
4469        return self._parse_placeholder()
4470
4471    def _parse_string_as_identifier(self) -> t.Optional[exp.Identifier]:
4472        return exp.to_identifier(self._match(TokenType.STRING) and self._prev.text, quoted=True)
4473
4474    def _parse_number(self) -> t.Optional[exp.Expression]:
4475        if self._match(TokenType.NUMBER):
4476            return self.PRIMARY_PARSERS[TokenType.NUMBER](self, self._prev)
4477        return self._parse_placeholder()
4478
4479    def _parse_identifier(self) -> t.Optional[exp.Expression]:
4480        if self._match(TokenType.IDENTIFIER):
4481            return self.expression(exp.Identifier, this=self._prev.text, quoted=True)
4482        return self._parse_placeholder()
4483
4484    def _parse_var(
4485        self, any_token: bool = False, tokens: t.Optional[t.Collection[TokenType]] = None
4486    ) -> t.Optional[exp.Expression]:
4487        if (
4488            (any_token and self._advance_any())
4489            or self._match(TokenType.VAR)
4490            or (self._match_set(tokens) if tokens else False)
4491        ):
4492            return self.expression(exp.Var, this=self._prev.text)
4493        return self._parse_placeholder()
4494
4495    def _advance_any(self) -> t.Optional[Token]:
4496        if self._curr and self._curr.token_type not in self.RESERVED_KEYWORDS:
4497            self._advance()
4498            return self._prev
4499        return None
4500
4501    def _parse_var_or_string(self) -> t.Optional[exp.Expression]:
4502        return self._parse_var() or self._parse_string()
4503
4504    def _parse_null(self) -> t.Optional[exp.Expression]:
4505        if self._match(TokenType.NULL):
4506            return self.PRIMARY_PARSERS[TokenType.NULL](self, self._prev)
4507        return self._parse_placeholder()
4508
4509    def _parse_boolean(self) -> t.Optional[exp.Expression]:
4510        if self._match(TokenType.TRUE):
4511            return self.PRIMARY_PARSERS[TokenType.TRUE](self, self._prev)
4512        if self._match(TokenType.FALSE):
4513            return self.PRIMARY_PARSERS[TokenType.FALSE](self, self._prev)
4514        return self._parse_placeholder()
4515
4516    def _parse_star(self) -> t.Optional[exp.Expression]:
4517        if self._match(TokenType.STAR):
4518            return self.PRIMARY_PARSERS[TokenType.STAR](self, self._prev)
4519        return self._parse_placeholder()
4520
4521    def _parse_parameter(self) -> exp.Parameter:
4522        wrapped = self._match(TokenType.L_BRACE)
4523        this = self._parse_var() or self._parse_identifier() or self._parse_primary()
4524        self._match(TokenType.R_BRACE)
4525        return self.expression(exp.Parameter, this=this, wrapped=wrapped)
4526
4527    def _parse_placeholder(self) -> t.Optional[exp.Expression]:
4528        if self._match_set(self.PLACEHOLDER_PARSERS):
4529            placeholder = self.PLACEHOLDER_PARSERS[self._prev.token_type](self)
4530            if placeholder:
4531                return placeholder
4532            self._advance(-1)
4533        return None
4534
4535    def _parse_except(self) -> t.Optional[t.List[exp.Expression]]:
4536        if not self._match(TokenType.EXCEPT):
4537            return None
4538        if self._match(TokenType.L_PAREN, advance=False):
4539            return self._parse_wrapped_csv(self._parse_column)
4540        return self._parse_csv(self._parse_column)
4541
4542    def _parse_replace(self) -> t.Optional[t.List[exp.Expression]]:
4543        if not self._match(TokenType.REPLACE):
4544            return None
4545        if self._match(TokenType.L_PAREN, advance=False):
4546            return self._parse_wrapped_csv(self._parse_expression)
4547        return self._parse_expressions()
4548
4549    def _parse_csv(
4550        self, parse_method: t.Callable, sep: TokenType = TokenType.COMMA
4551    ) -> t.List[exp.Expression]:
4552        parse_result = parse_method()
4553        items = [parse_result] if parse_result is not None else []
4554
4555        while self._match(sep):
4556            self._add_comments(parse_result)
4557            parse_result = parse_method()
4558            if parse_result is not None:
4559                items.append(parse_result)
4560
4561        return items
4562
4563    def _parse_tokens(
4564        self, parse_method: t.Callable, expressions: t.Dict
4565    ) -> t.Optional[exp.Expression]:
4566        this = parse_method()
4567
4568        while self._match_set(expressions):
4569            this = self.expression(
4570                expressions[self._prev.token_type],
4571                this=this,
4572                comments=self._prev_comments,
4573                expression=parse_method(),
4574            )
4575
4576        return this
4577
4578    def _parse_wrapped_id_vars(self, optional: bool = False) -> t.List[exp.Expression]:
4579        return self._parse_wrapped_csv(self._parse_id_var, optional=optional)
4580
4581    def _parse_wrapped_csv(
4582        self, parse_method: t.Callable, sep: TokenType = TokenType.COMMA, optional: bool = False
4583    ) -> t.List[exp.Expression]:
4584        return self._parse_wrapped(
4585            lambda: self._parse_csv(parse_method, sep=sep), optional=optional
4586        )
4587
4588    def _parse_wrapped(self, parse_method: t.Callable, optional: bool = False) -> t.Any:
4589        wrapped = self._match(TokenType.L_PAREN)
4590        if not wrapped and not optional:
4591            self.raise_error("Expecting (")
4592        parse_result = parse_method()
4593        if wrapped:
4594            self._match_r_paren()
4595        return parse_result
4596
4597    def _parse_expressions(self) -> t.List[exp.Expression]:
4598        return self._parse_csv(self._parse_expression)
4599
4600    def _parse_select_or_expression(self, alias: bool = False) -> t.Optional[exp.Expression]:
4601        return self._parse_select() or self._parse_set_operations(
4602            self._parse_expression() if alias else self._parse_conjunction()
4603        )
4604
4605    def _parse_ddl_select(self) -> t.Optional[exp.Expression]:
4606        return self._parse_query_modifiers(
4607            self._parse_set_operations(self._parse_select(nested=True, parse_subquery_alias=False))
4608        )
4609
4610    def _parse_transaction(self) -> exp.Transaction | exp.Command:
4611        this = None
4612        if self._match_texts(self.TRANSACTION_KIND):
4613            this = self._prev.text
4614
4615        self._match_texts({"TRANSACTION", "WORK"})
4616
4617        modes = []
4618        while True:
4619            mode = []
4620            while self._match(TokenType.VAR):
4621                mode.append(self._prev.text)
4622
4623            if mode:
4624                modes.append(" ".join(mode))
4625            if not self._match(TokenType.COMMA):
4626                break
4627
4628        return self.expression(exp.Transaction, this=this, modes=modes)
4629
4630    def _parse_commit_or_rollback(self) -> exp.Commit | exp.Rollback:
4631        chain = None
4632        savepoint = None
4633        is_rollback = self._prev.token_type == TokenType.ROLLBACK
4634
4635        self._match_texts({"TRANSACTION", "WORK"})
4636
4637        if self._match_text_seq("TO"):
4638            self._match_text_seq("SAVEPOINT")
4639            savepoint = self._parse_id_var()
4640
4641        if self._match(TokenType.AND):
4642            chain = not self._match_text_seq("NO")
4643            self._match_text_seq("CHAIN")
4644
4645        if is_rollback:
4646            return self.expression(exp.Rollback, savepoint=savepoint)
4647
4648        return self.expression(exp.Commit, chain=chain)
4649
4650    def _parse_add_column(self) -> t.Optional[exp.Expression]:
4651        if not self._match_text_seq("ADD"):
4652            return None
4653
4654        self._match(TokenType.COLUMN)
4655        exists_column = self._parse_exists(not_=True)
4656        expression = self._parse_field_def()
4657
4658        if expression:
4659            expression.set("exists", exists_column)
4660
4661            # https://docs.databricks.com/delta/update-schema.html#explicitly-update-schema-to-add-columns
4662            if self._match_texts(("FIRST", "AFTER")):
4663                position = self._prev.text
4664                column_position = self.expression(
4665                    exp.ColumnPosition, this=self._parse_column(), position=position
4666                )
4667                expression.set("position", column_position)
4668
4669        return expression
4670
4671    def _parse_drop_column(self) -> t.Optional[exp.Drop | exp.Command]:
4672        drop = self._match(TokenType.DROP) and self._parse_drop()
4673        if drop and not isinstance(drop, exp.Command):
4674            drop.set("kind", drop.args.get("kind", "COLUMN"))
4675        return drop
4676
4677    # https://docs.aws.amazon.com/athena/latest/ug/alter-table-drop-partition.html
4678    def _parse_drop_partition(self, exists: t.Optional[bool] = None) -> exp.DropPartition:
4679        return self.expression(
4680            exp.DropPartition, expressions=self._parse_csv(self._parse_partition), exists=exists
4681        )
4682
4683    def _parse_add_constraint(self) -> exp.AddConstraint:
4684        this = None
4685        kind = self._prev.token_type
4686
4687        if kind == TokenType.CONSTRAINT:
4688            this = self._parse_id_var()
4689
4690            if self._match_text_seq("CHECK"):
4691                expression = self._parse_wrapped(self._parse_conjunction)
4692                enforced = self._match_text_seq("ENFORCED")
4693
4694                return self.expression(
4695                    exp.AddConstraint, this=this, expression=expression, enforced=enforced
4696                )
4697
4698        if kind == TokenType.FOREIGN_KEY or self._match(TokenType.FOREIGN_KEY):
4699            expression = self._parse_foreign_key()
4700        elif kind == TokenType.PRIMARY_KEY or self._match(TokenType.PRIMARY_KEY):
4701            expression = self._parse_primary_key()
4702        else:
4703            expression = None
4704
4705        return self.expression(exp.AddConstraint, this=this, expression=expression)
4706
4707    def _parse_alter_table_add(self) -> t.List[exp.Expression]:
4708        index = self._index - 1
4709
4710        if self._match_set(self.ADD_CONSTRAINT_TOKENS):
4711            return self._parse_csv(self._parse_add_constraint)
4712
4713        self._retreat(index)
4714        if not self.ALTER_TABLE_ADD_COLUMN_KEYWORD and self._match_text_seq("ADD"):
4715            return self._parse_csv(self._parse_field_def)
4716
4717        return self._parse_csv(self._parse_add_column)
4718
4719    def _parse_alter_table_alter(self) -> exp.AlterColumn:
4720        self._match(TokenType.COLUMN)
4721        column = self._parse_field(any_token=True)
4722
4723        if self._match_pair(TokenType.DROP, TokenType.DEFAULT):
4724            return self.expression(exp.AlterColumn, this=column, drop=True)
4725        if self._match_pair(TokenType.SET, TokenType.DEFAULT):
4726            return self.expression(exp.AlterColumn, this=column, default=self._parse_conjunction())
4727
4728        self._match_text_seq("SET", "DATA")
4729        return self.expression(
4730            exp.AlterColumn,
4731            this=column,
4732            dtype=self._match_text_seq("TYPE") and self._parse_types(),
4733            collate=self._match(TokenType.COLLATE) and self._parse_term(),
4734            using=self._match(TokenType.USING) and self._parse_conjunction(),
4735        )
4736
4737    def _parse_alter_table_drop(self) -> t.List[exp.Expression]:
4738        index = self._index - 1
4739
4740        partition_exists = self._parse_exists()
4741        if self._match(TokenType.PARTITION, advance=False):
4742            return self._parse_csv(lambda: self._parse_drop_partition(exists=partition_exists))
4743
4744        self._retreat(index)
4745        return self._parse_csv(self._parse_drop_column)
4746
4747    def _parse_alter_table_rename(self) -> exp.RenameTable:
4748        self._match_text_seq("TO")
4749        return self.expression(exp.RenameTable, this=self._parse_table(schema=True))
4750
4751    def _parse_alter(self) -> exp.AlterTable | exp.Command:
4752        start = self._prev
4753
4754        if not self._match(TokenType.TABLE):
4755            return self._parse_as_command(start)
4756
4757        exists = self._parse_exists()
4758        this = self._parse_table(schema=True)
4759
4760        if self._next:
4761            self._advance()
4762
4763        parser = self.ALTER_PARSERS.get(self._prev.text.upper()) if self._prev else None
4764        if parser:
4765            actions = ensure_list(parser(self))
4766
4767            if not self._curr:
4768                return self.expression(
4769                    exp.AlterTable,
4770                    this=this,
4771                    exists=exists,
4772                    actions=actions,
4773                )
4774        return self._parse_as_command(start)
4775
4776    def _parse_merge(self) -> exp.Merge:
4777        self._match(TokenType.INTO)
4778        target = self._parse_table()
4779
4780        if target and self._match(TokenType.ALIAS, advance=False):
4781            target.set("alias", self._parse_table_alias())
4782
4783        self._match(TokenType.USING)
4784        using = self._parse_table()
4785
4786        self._match(TokenType.ON)
4787        on = self._parse_conjunction()
4788
4789        whens = []
4790        while self._match(TokenType.WHEN):
4791            matched = not self._match(TokenType.NOT)
4792            self._match_text_seq("MATCHED")
4793            source = (
4794                False
4795                if self._match_text_seq("BY", "TARGET")
4796                else self._match_text_seq("BY", "SOURCE")
4797            )
4798            condition = self._parse_conjunction() if self._match(TokenType.AND) else None
4799
4800            self._match(TokenType.THEN)
4801
4802            if self._match(TokenType.INSERT):
4803                _this = self._parse_star()
4804                if _this:
4805                    then: t.Optional[exp.Expression] = self.expression(exp.Insert, this=_this)
4806                else:
4807                    then = self.expression(
4808                        exp.Insert,
4809                        this=self._parse_value(),
4810                        expression=self._match(TokenType.VALUES) and self._parse_value(),
4811                    )
4812            elif self._match(TokenType.UPDATE):
4813                expressions = self._parse_star()
4814                if expressions:
4815                    then = self.expression(exp.Update, expressions=expressions)
4816                else:
4817                    then = self.expression(
4818                        exp.Update,
4819                        expressions=self._match(TokenType.SET)
4820                        and self._parse_csv(self._parse_equality),
4821                    )
4822            elif self._match(TokenType.DELETE):
4823                then = self.expression(exp.Var, this=self._prev.text)
4824            else:
4825                then = None
4826
4827            whens.append(
4828                self.expression(
4829                    exp.When,
4830                    matched=matched,
4831                    source=source,
4832                    condition=condition,
4833                    then=then,
4834                )
4835            )
4836
4837        return self.expression(
4838            exp.Merge,
4839            this=target,
4840            using=using,
4841            on=on,
4842            expressions=whens,
4843        )
4844
4845    def _parse_show(self) -> t.Optional[exp.Expression]:
4846        parser = self._find_parser(self.SHOW_PARSERS, self.SHOW_TRIE)
4847        if parser:
4848            return parser(self)
4849        self._advance()
4850        return self.expression(exp.Show, this=self._prev.text.upper())
4851
4852    def _parse_set_item_assignment(
4853        self, kind: t.Optional[str] = None
4854    ) -> t.Optional[exp.Expression]:
4855        index = self._index
4856
4857        if kind in {"GLOBAL", "SESSION"} and self._match_text_seq("TRANSACTION"):
4858            return self._parse_set_transaction(global_=kind == "GLOBAL")
4859
4860        left = self._parse_primary() or self._parse_id_var()
4861
4862        if not self._match_texts(("=", "TO")):
4863            self._retreat(index)
4864            return None
4865
4866        right = self._parse_statement() or self._parse_id_var()
4867        this = self.expression(exp.EQ, this=left, expression=right)
4868
4869        return self.expression(exp.SetItem, this=this, kind=kind)
4870
4871    def _parse_set_transaction(self, global_: bool = False) -> exp.Expression:
4872        self._match_text_seq("TRANSACTION")
4873        characteristics = self._parse_csv(
4874            lambda: self._parse_var_from_options(self.TRANSACTION_CHARACTERISTICS)
4875        )
4876        return self.expression(
4877            exp.SetItem,
4878            expressions=characteristics,
4879            kind="TRANSACTION",
4880            **{"global": global_},  # type: ignore
4881        )
4882
4883    def _parse_set_item(self) -> t.Optional[exp.Expression]:
4884        parser = self._find_parser(self.SET_PARSERS, self.SET_TRIE)
4885        return parser(self) if parser else self._parse_set_item_assignment(kind=None)
4886
4887    def _parse_set(self, unset: bool = False, tag: bool = False) -> exp.Set | exp.Command:
4888        index = self._index
4889        set_ = self.expression(
4890            exp.Set, expressions=self._parse_csv(self._parse_set_item), unset=unset, tag=tag
4891        )
4892
4893        if self._curr:
4894            self._retreat(index)
4895            return self._parse_as_command(self._prev)
4896
4897        return set_
4898
4899    def _parse_var_from_options(self, options: t.Collection[str]) -> t.Optional[exp.Var]:
4900        for option in options:
4901            if self._match_text_seq(*option.split(" ")):
4902                return exp.var(option)
4903        return None
4904
4905    def _parse_as_command(self, start: Token) -> exp.Command:
4906        while self._curr:
4907            self._advance()
4908        text = self._find_sql(start, self._prev)
4909        size = len(start.text)
4910        return exp.Command(this=text[:size], expression=text[size:])
4911
4912    def _parse_dict_property(self, this: str) -> exp.DictProperty:
4913        settings = []
4914
4915        self._match_l_paren()
4916        kind = self._parse_id_var()
4917
4918        if self._match(TokenType.L_PAREN):
4919            while True:
4920                key = self._parse_id_var()
4921                value = self._parse_primary()
4922
4923                if not key and value is None:
4924                    break
4925                settings.append(self.expression(exp.DictSubProperty, this=key, value=value))
4926            self._match(TokenType.R_PAREN)
4927
4928        self._match_r_paren()
4929
4930        return self.expression(
4931            exp.DictProperty,
4932            this=this,
4933            kind=kind.this if kind else None,
4934            settings=settings,
4935        )
4936
4937    def _parse_dict_range(self, this: str) -> exp.DictRange:
4938        self._match_l_paren()
4939        has_min = self._match_text_seq("MIN")
4940        if has_min:
4941            min = self._parse_var() or self._parse_primary()
4942            self._match_text_seq("MAX")
4943            max = self._parse_var() or self._parse_primary()
4944        else:
4945            max = self._parse_var() or self._parse_primary()
4946            min = exp.Literal.number(0)
4947        self._match_r_paren()
4948        return self.expression(exp.DictRange, this=this, min=min, max=max)
4949
4950    def _parse_comprehension(self, this: exp.Expression) -> exp.Comprehension:
4951        expression = self._parse_column()
4952        self._match(TokenType.IN)
4953        iterator = self._parse_column()
4954        condition = self._parse_conjunction() if self._match_text_seq("IF") else None
4955        return self.expression(
4956            exp.Comprehension,
4957            this=this,
4958            expression=expression,
4959            iterator=iterator,
4960            condition=condition,
4961        )
4962
4963    def _find_parser(
4964        self, parsers: t.Dict[str, t.Callable], trie: t.Dict
4965    ) -> t.Optional[t.Callable]:
4966        if not self._curr:
4967            return None
4968
4969        index = self._index
4970        this = []
4971        while True:
4972            # The current token might be multiple words
4973            curr = self._curr.text.upper()
4974            key = curr.split(" ")
4975            this.append(curr)
4976
4977            self._advance()
4978            result, trie = in_trie(trie, key)
4979            if result == TrieResult.FAILED:
4980                break
4981
4982            if result == TrieResult.EXISTS:
4983                subparser = parsers[" ".join(this)]
4984                return subparser
4985
4986        self._retreat(index)
4987        return None
4988
4989    def _match(self, token_type, advance=True, expression=None):
4990        if not self._curr:
4991            return None
4992
4993        if self._curr.token_type == token_type:
4994            if advance:
4995                self._advance()
4996            self._add_comments(expression)
4997            return True
4998
4999        return None
5000
5001    def _match_set(self, types, advance=True):
5002        if not self._curr:
5003            return None
5004
5005        if self._curr.token_type in types:
5006            if advance:
5007                self._advance()
5008            return True
5009
5010        return None
5011
5012    def _match_pair(self, token_type_a, token_type_b, advance=True):
5013        if not self._curr or not self._next:
5014            return None
5015
5016        if self._curr.token_type == token_type_a and self._next.token_type == token_type_b:
5017            if advance:
5018                self._advance(2)
5019            return True
5020
5021        return None
5022
5023    def _match_l_paren(self, expression: t.Optional[exp.Expression] = None) -> None:
5024        if not self._match(TokenType.L_PAREN, expression=expression):
5025            self.raise_error("Expecting (")
5026
5027    def _match_r_paren(self, expression: t.Optional[exp.Expression] = None) -> None:
5028        if not self._match(TokenType.R_PAREN, expression=expression):
5029            self.raise_error("Expecting )")
5030
5031    def _match_texts(self, texts, advance=True):
5032        if self._curr and self._curr.text.upper() in texts:
5033            if advance:
5034                self._advance()
5035            return True
5036        return False
5037
5038    def _match_text_seq(self, *texts, advance=True):
5039        index = self._index
5040        for text in texts:
5041            if self._curr and self._curr.text.upper() == text:
5042                self._advance()
5043            else:
5044                self._retreat(index)
5045                return False
5046
5047        if not advance:
5048            self._retreat(index)
5049
5050        return True
5051
5052    @t.overload
5053    def _replace_columns_with_dots(self, this: exp.Expression) -> exp.Expression:
5054        ...
5055
5056    @t.overload
5057    def _replace_columns_with_dots(
5058        self, this: t.Optional[exp.Expression]
5059    ) -> t.Optional[exp.Expression]:
5060        ...
5061
5062    def _replace_columns_with_dots(self, this):
5063        if isinstance(this, exp.Dot):
5064            exp.replace_children(this, self._replace_columns_with_dots)
5065        elif isinstance(this, exp.Column):
5066            exp.replace_children(this, self._replace_columns_with_dots)
5067            table = this.args.get("table")
5068            this = (
5069                self.expression(exp.Dot, this=table, expression=this.this) if table else this.this
5070            )
5071
5072        return this
5073
5074    def _replace_lambda(
5075        self, node: t.Optional[exp.Expression], lambda_variables: t.Set[str]
5076    ) -> t.Optional[exp.Expression]:
5077        if not node:
5078            return node
5079
5080        for column in node.find_all(exp.Column):
5081            if column.parts[0].name in lambda_variables:
5082                dot_or_id = column.to_dot() if column.table else column.this
5083                parent = column.parent
5084
5085                while isinstance(parent, exp.Dot):
5086                    if not isinstance(parent.parent, exp.Dot):
5087                        parent.replace(dot_or_id)
5088                        break
5089                    parent = parent.parent
5090                else:
5091                    if column is node:
5092                        node = dot_or_id
5093                    else:
5094                        column.replace(dot_or_id)
5095        return node

logger = <Logger sqlglot (WARNING)>

def parse_var_map(args: List) -> sqlglot.expressions.StarMap | sqlglot.expressions.VarMap: View Source

21def parse_var_map(args: t.List) -> exp.StarMap | exp.VarMap:
22    if len(args) == 1 and args[0].is_star:
23        return exp.StarMap(this=args[0])
24
25    keys = []
26    values = []
27    for i in range(0, len(args), 2):
28        keys.append(args[i])
29        values.append(args[i + 1])
30
31    return exp.VarMap(
32        keys=exp.Array(expressions=keys),
33        values=exp.Array(expressions=values),
34    )

def parse_like(args: List) -> sqlglot.expressions.Escape | sqlglot.expressions.Like: View Source

37def parse_like(args: t.List) -> exp.Escape | exp.Like:
38    like = exp.Like(this=seq_get(args, 1), expression=seq_get(args, 0))
39    return exp.Escape(this=like, expression=seq_get(args, 2)) if len(args) > 2 else like

def binary_range_parser( expr_type: Type[sqlglot.expressions.Expression]) -> Callable[[sqlglot.parser.Parser, Optional[sqlglot.expressions.Expression]], Optional[sqlglot.expressions.Expression]]: View Source

42def binary_range_parser(
43    expr_type: t.Type[exp.Expression],
44) -> t.Callable[[Parser, t.Optional[exp.Expression]], t.Optional[exp.Expression]]:
45    return lambda self, this: self._parse_escape(
46        self.expression(expr_type, this=this, expression=self._parse_bitwise())
47    )

sqlglot.parser

Arguments:

Arguments:

Returns:

Arguments:

Returns:

Arguments:

Returns:

Arguments:

Returns: