← 论文卡片

[Bespoke-Card] Why Tune When You Can Generate? Synthesizing Workload-Specific Cardinality Estimators

  • 类型:arxiv
  • 标识:2606.09361
  • 链接:https://arxiv.org/abs/2606.09361
  • 主题:agent, database, engineering, evaluation, llm-infra, multimodal, rag
  • 来源文件
  • /inbox/jay/2026-06-13-weekly-briefing.md

可复用信息

    • 现有时序相似性搜索要求用户提供精确数值序列,实际场景中用户更想用趋势、值域、通配符来表达模式。
    • TSseek 提出正则驱动搜索框架,将时序对象映射为线段序列(保留斜率+值域),将正则查询转化为有界矩形,在分布式空间索引 TSseek-X 上处理全匹配和子序列匹配两种查询。
    • 在基准和真实数据集上,击败全扫描/SAX/PAA 基线,子序列查询对 SOTA 子序列匹配引擎也有显著加速。
    • 工程启示:时序数据支持正则模式匹配是工程化系统(如 IoT、日志异常检测)的重要需求,TSseek 的分布式空间索引设计值得参考。
    • 是否精读:⭐⭐⭐ · 推荐精读其分布式索引设计(TSseek-X)

  • [Bespoke-Card] Why Tune When You Can Generate? Synthesizing Workload-Specific Cardinality Estimators
    • 作者:Johannes Wehrstein et al. · Under Review for AIDB@VLDB'26

写作用途

  • 可放入 RAG / 知识库 / 检索增强相关工作的对比段。
  • 可用于 Agent 架构、记忆、工具调用或多智能体研究背景。
  • 可用于多模态推理、视觉语言模型或长上下文多模态问题定义。
  • 可用于系统实现、实验平台或工程约束说明。

待补齐

  • BibTeX / 正式引用格式
  • 方法与实验设置细节
  • 与现有工作的差异点
  • 是否有代码和数据集