语义设置
信息
目前暂时只支持 Calendar 语义.
为了提升平台与大模型(如 Deepseek)在数据分析、自然语言查询等场景下的配合效果,XpertAI 支持对维度及其层级配置语义属性。 这些语义设置有助于平台更准确地理解字段含义、进行智能转换与隐藏不必要的复杂性,尤其在接入大模型进行智能问答、智能报表时具有关键作用。
语义类型
语义类型用于标注层级的业务含义,尤其适用于时间类维度,帮助系统与大模型理解“年”、“月”、“日”等字段的真实含义。
✅ 常见的语义类型包括:
层级名称 | 语义类型 | 示例值 |
---|---|---|
年 | Calendar.Year | 2023 |
月 | Calendar.Month | [2023].[05] |
日 | Calendar.Day | [2023].[05].[01] |
设置语义类型后,系统将能够识别该层级为时间结构的一部分,进而支持:
- 大模型智能识别时间条件(如“近三个月”、“去年12月”);
- 时间对齐、时间滚动等自动化分析;
- 自动生成自然语言中的时间表达。
📌 设置建议:
- 仅对标准日历维度配置语义类型;
- 维度名/层级名不需要包含“时间”关键字,但语义需正确配置。
格式化字符串
当层级类型为 Calendar 之类型时,需要为该层级指定一个格式化字符串,用于将原始 Date 对象转换为实际的成员值(即技术 ID)。
🎯 示例:
维度 | 层级 | 格式化模式 | 技术 ID 示例 |
---|---|---|---|
order_date | 1 | yyyy | 2023 |
order_date | 2 | [yyyy].[MM] | [2023].[05] |
order_date | 3 | [yyyy].[MM].[dd] | [2023].[05].[01] |
这一步对于大模型理解用户自然语言中涉及的“时间表达”至关重要。例如:
用户输入:“统计今年每月销售额”
平台会自动将“今年”识别为当前年份,如“2025”,并格式化为 “[2025].[01]”, “[2025].[02]” 等技术 ID 传入模型,从而获取精准的分析结果。
📌 提示:
- 请确保格式化模式与底层字段格式一致;
- 支持的格式与 JavaScript 中的 【date-fns】 类似;
- 格式化后字段会作为实际查询条件传递给大模型与数据查询引擎。
对大模型隐藏
在一些场景中,某些维度或层级虽然对内部系统分析重要,但并不适合暴露给大模型参与自然语言推理。
例如:
- ID 字段(如商品编码、组织代码);
- 技术性强的层级(如排序辅助字段、系统生成标识);
- 多余或复杂的冗余条件字段。
✨ 设置为“大模型隐藏”后:
- 在大模型获取模型信息过程中将自动忽略这些维度或层级;
- 有助于简化提示词空间,减少干扰;
- 提升大模型的准确率与回答质量。
📌 实践建议:
- 对业务用户不关心但系统内部依赖的层级建议隐藏;
- 对维度下仅供内部计算或过滤的辅助字段建议隐藏;
- 尽量减少暴露 ID 类型层级给大模型。