Hive的内置函数列表。下面是这些函数按类别归纳后的简要说明:

数学函数

  • abs: 绝对值
  • acos: 反余弦
  • asin: 反正弦
  • atan: 反正切
  • cbrt: 立方根
  • ceil, ceiling: 向上取整
  • cos: 余弦
  • exp: 指数
  • floor: 向下取整
  • log, log10, log2: 对数
  • pi: 圆周率
  • pow, power: 幂
  • radians: 弧度
  • rand: 随机数
  • round: 四舍五入
  • sign: 符号函数
  • sin: 正弦
  • sqrt: 平方根
  • tan: 正切

字符串函数

  • ascii: 返回字符的ASCII码
  • base64: Base64编码
  • bin: 二进制表示
  • concat, concat_ws: 连接字符串
  • decode: 解码
  • encode: 编码
  • find_in_set: 查找字符串在集合中的位置
  • format_number: 格式化数字
  • hex: 十六进制表示
  • initcap: 单词首字母大写
  • instr: 查找子字符串位置
  • length: 字符串长度
  • lower, lcase: 转为小写
  • lpad: 左填充
  • ltrim: 左侧去空格
  • repeat: 重复字符串
  • reverse: 反转字符串
  • rpad: 右填充
  • rtrim: 右侧去空格
  • space: 生成空格字符串
  • split: 分割字符串
  • substr, substring: 截取子字符串
  • translate: 替换字符
  • trim: 去空格
  • upper, ucase: 转为大写

日期函数

  • add_months: 增加月份
  • current_date: 当前日期
  • current_timestamp: 当前时间戳
  • date_add: 增加天数
  • date_format: 日期格式化
  • date_sub: 减少天数
  • datediff: 计算日期差
  • day, dayofmonth: 天
  • from_unixtime: 从Unix时间戳转换
  • from_utc_timestamp: 从UTC时间戳转换
  • hour: 小时
  • last_day: 月的最后一天
  • minute: 分钟
  • month: 月份
  • months_between: 月份差
  • next_day: 下一个指定的工作日
  • second: 秒
  • to_date: 转换为日期
  • to_unix_timestamp: 转换为Unix时间戳
  • to_utc_timestamp: 转换为UTC时间戳
  • unix_timestamp: 当前Unix时间戳
  • weekofyear: 年的第几周
  • year: 年

聚合函数

  • avg: 平均值
  • collect_list: 聚合为列表
  • collect_set: 聚合为集合
  • corr: 相关系数
  • count: 计数
  • covar_pop: 人口协方差
  • covar_samp: 样本协方差
  • first_value: 第一个值
  • last_value: 最后一个值
  • max: 最大值
  • min: 最小值
  • percentile, percentile_approx: 百分位数
  • std, stddev, stddev_pop, stddev_samp: 标准差
  • sum: 求和
  • var_pop: 人口方差
  • var_samp: 样本方差
  • variance: 方差

条件函数

  • and: 逻辑与
  • between: 在某范围内
  • case: 条件判断
  • if: 条件判断
  • in: 在集合内
  • not: 逻辑非
  • or: 逻辑或
  • when: 条件判断

其他函数

  • array, array_contains: 数组操作
  • compute_stats: 计算统计
  • context_ngrams: 上下文N-gram
  • create_union: 创建联合
  • current_database: 当前数据库
  • current_user: 当前用户
  • decode, encode: 编码解码
  • ewah_bitmap, ewah_bitmap_and, ewah_bitmap_empty, ewah_bitmap_or: EWAH位图操作
  • explode, posexplode: 展开数组或映射
  • field: 字段
  • get_json_object: 从JSON中获取对象
  • histogram_numeric: 数值直方图
  • json_tuple: 从JSON中获取元组
  • levenshtein: Levenshtein距离
  • like: 模糊匹配
  • map, map_keys, map_values: 映射操作
  • noop, noopstreaming, noopwithmap, noopwithmapstreaming: 无操作函数
  • parse_url, parse_url_tuple: 解析URL
  • reflect, reflect2: 反射调用
  • regexp, regexp_extract, regexp_replace, rlike: 正则表达式操作
  • sentences: 句子分割
  • sort_array: 排序数组
  • soundex: Soundex编码
  • stack: 堆栈
  • str_to_map: 字符串转换为映射
  • struct: 结构体
  • uuid: 生成UUID
  • version: Hive版本信息
  • xpath, xpath_boolean, xpath_double, xpath_float, xpath_int, xpath_long, xpath_number, xpath_short, xpath_string: XPath查询

特殊操作符

  • !, !=: 不等于
  • %: 取模
  • &: 按位与
  • *: 乘
  • +: 加
  • -: 减
  • /: 除
  • <, <=: 小于,小于等于
  • <=>, <>: 不等于
  • =: 等于
  • >, >=: 大于,大于等于
  • ^: 按位异或
  • |: 按位或
  • ~: 按位非

这是一个详细的Hive内置函数的列表。你可以根据具体需要使用相应的函数来进行数据处理和查询操作。如果你对某个函数的具体用法不清楚,可以参考Hive的官方文档或使用DESCRIBE FUNCTION命令来获取详细信息。


s8fh26h3
18 声望1 粉丝

引用和评论

0 条评论