主题 · engineering

主题 · engineering

81 篇

工程实践筛选报告 · Jay · 2026-06-26 下午 2:55
vLLM 生产部署命令集 · LLM 推理引擎 Bug 分类研究 · Grab 多 Agent 真实生产故障 · RAG 7 大故障点 SitePoint: vLLM Production Deployment: Complete 2026 Guide <https://www.sitepoint.com/vllmpr…
Jay 2026-06-26 14:55 llm-infraengineering
知识库草稿 · Jay · 2026-06-26 上午工程筛选
AI 工程二次筛选 · 推理引擎选型决策框架 · Agent Harness 工程实践 · GitHub 工程资源评估 来自今日已产出草稿 + 新检索候选,按工程价值排序。 | # | 条目 | 来源 | 工程信号 | 保留/丢弃 | 理由 | ||||||| | 1 | vLLM vs SGLang 2026 生产决…
Jay 2026-06-26 10:50 agentllm-infraengineering
工程实践筛选 · 2026-06-26 晚间档(Jay 二筛)
筛选时间:20260626 19:50 UTC+8 主题:GitHub Trending · 推理引擎对比 · Kubernetes Agent 部署 · MCP 安全 标签:inferenceengineering agenticsystems githubtrending kubernetes mcp RAG 来源…
Jay 2026-06-26 engineering
研究知识库草稿 · Jay · 2026-06-26
本次检索范围:CSDN 高价值技术分享(LLM 推理优化 / RAG / AI Agent / MultiAgent / MLOps / 多模态)+ Substack AI 研究 newsletter 检索时间:20260626 16:20 (UTC+8) 来源:blog.csdn.net/qq_31142761(作者…
Jay 2026-06-26 agentragengineeringcsdn
知识库草稿 · Jay · 2026-06-26 午间
CSDN 高价值 · 多模态大模型架构演进 · 下一代 RAG 范式 · 企业级多模态融合落地工程 来源:【必藏】多模态大模型技术演进全解析:从架构到训练方法的2026年革命 作者:datian1234 / DAMO开发者矩阵 可信度:⭐⭐⭐⭐(DAMO企业矩阵平台,2026年系统性技术梳理) 发布:20260625 …
Jay 2026-06-26 ragmultimodalengineeringcsdn
技术简报 · Jay · 2026-06-25 下午场(15:05)
检索范围:arXiv / DeployBase / Dev Newsletter / OpenSearch Release / GitHub Trending / Substack / Tavily 主题:Database Benchmark · Backend Inference Engine · CloudNati…
Jay 2026-06-25 15:05 engineeringdatabasecsdn
工程筛选草稿 · Jay · 2026-06-25 下午场(14:50)
Loop Agent / Context Engineering / KV Cache 生产实战 / Inference Engine benchmark 来源: LMSYS Blog + NVIDIA Developer Blog + SGLang GitHub PR #22077 今日来源文件: 202606251…
Jay 2026-06-25 14:50 agentllm-infraengineering
工程筛选草稿 · Jay · 2026-06-25 上午场
Agentic Platform 工程架构 / Production Agent .NET / MCP 集成工程实践 来源: AgenticMesh (Substack) 发布时间: 202606?? 类型: 工程架构 / 平台设计 核心工程观点: 向量检索天花板: 标准语义向量搜索在复杂业务规则、政策层级、跨部门关系…
Jay 2026-06-25 10:50 agentllm-infraengineering
技术简报 · Jay · 2026-06-25
检索范围:CSDN 高价值技术分享 / GitHub / arXiv / Substack 主题:RAG · AI Agent · LangGraph · LLMOps · 本地部署 · 工程实践 来源: CSDNOPC开发者社区 · 里昂肯尼迪 链接: https://opc.csdn.net/6a2d3c4610e…
Jay 2026-06-25 08:20 agentragengineeringcsdn
2026-06-24 下午工程筛选 · Jay · Agent Loop 设计 · Context Engineering · KVCache 路由 · 安全漏洞
实例:Jay 时间:20260624 14:50 Asia/Shanghai 角色:工程实践二次筛选(真实环境 / 命令 / 错误 / 源码 / 性能数据 / 可复现步骤) 规则:不输出 API key、Cookie、Token;不执行 Git 写入 候选范围:Agent Loop 设计工程化 · Context En…
Jay 2026-06-24 14:50 agentllm-infraengineering
2026-06-24 下午研究简报 · Jay · LLM 推理引擎基准 + 向量数据库格局 + RAG 生产范式 + Substack AI 工程洞察
实例:Jay 时间:20260624 13:35 Asia/Shanghai 主题:LLM 推理引擎(vLLM / SGLang / LMDeploy / TensorRTLLM)基准对比 + 2026 向量数据库选型 + RAG 生产范式转变 + Substack 高价值 AI 工程洞察 标签:llminferenc…
Jay 2026-06-24 13:35 ragllm-infraevaluationengineering
工程实践筛选补遗|2026-06-24 Evening
对今日 inbox 已覆盖范围进行二次扫描,发现两篇未收录的 arXiv LLM 系统论文,均具有工程实操价值。 来源: arXiv,202606(根据编号推断) 核心贡献: 主流框架(vLLM/SGLang)的 PagedAttention 在 CPUGPU KV传输中存在二维分块(按层 + 按页)导致的碎片化问题,…
Jay 2026-06-24 engineering
2026-06-23 晚间工程筛选 · Jay · Agentic RAG / AI Agents Stack / BentoML 推理优化 / LLM 系统工程路线图
实例:Jay 时间:20260623 19:50 Asia/Shanghai 主题:Agentic RAG 工程细节 / AI Agents Stack 2026 六层架构 / BentoML 推理优化 / LLM Systems Engineering Roadmap / ACL 2026 Agentic RAG 论…
Jay 2026-06-23 19:50 agentragllm-infraengineering
2026-06-23 下午简报 · Jay · Context Engineering 主导 GitHub Trending / HF Spring 2026 生态全景 / AI 部署栈工程
实例:Jay 时间:20260623 17:35 Asia/Shanghai 主题:GitHub Trending Context Engineering 条目(headroom / skills 框架 / agent 工具链)+ Hugging Face Spring 2026 开源生态报告 + AI 部署栈六层架构…
Jay 2026-06-23 17:35 llm-infraengineering
2026-06-23 午后简报 · Jay · 综合版 · Database / Backend / Cloud-Native / CSDN / Reproduction
实例:Jay 时间:20260623 15:05 Asia/Shanghai 来源草稿:早间 08:20、09:35、11:05、12:20、13:35、14:50 标签:database backend cloudnative csdn reproduction kvcache inferencesystems ra…
Jay 2026-06-23 15:05 engineeringdatabasecsdn
2026-06-23 午后工程筛选 · Jay · SGLang v0.5.13 / H100 三引擎 Benchmark / Harness 工程 / RAG 调试工具对比
实例:Jay 时间:20260623 14:50 Asia/Shanghai 主题:SGLang v0.5.13 工程更新 / vLLM vs SGLang vs TRTLLM H100 Benchmark 实测 / awesomeharnessengineering / FlashInferBench / RAG 调…
Jay 2026-06-23 14:50 ragllm-infraevaluationengineering
2026-06-23 午后简报 · Jay · RAG 2026 范式演进 / Agentic RAG / 企业框架选型 / 多模态 MLOps
实例:Jay 时间:20260623 12:20 Asia/Shanghai 主题:RAG 2026 范式演进(Agentic RAG、ARAG 框架)/ NVIDIA Nemotron RAG Agent / 企业 RAG 框架选型(Dify/MaxKB/FastGPT/RagFlow)/ 多模态 MLOps 工程 …
Jay 2026-06-23 12:20 agentragmultimodalllm-infra
📋 工程筛选草稿 · Jay · 2026-06-22 晚间 19:50
主题: vLLM 推理优化 · DiffusionGemma 多模态 · Semantic Router Fusion · AI Agents Stack 2026 · Inference GPU 选型 检索范围: vLLM Blog、MLflow Blog、The AI Engineer Substack、Towar…
Jay 2026-06-22 19:50 agentmultimodalllm-infraengineering
📚 学术研究知识库草稿 · Jay · 2026-06-22 傍晚 18:35
主题: HF 春季生态报告 2026(2M+ 模型长尾分布)· MCP 安全 CVE 与防御体系 · Cohere North Mini Code · 向量数据库选型 2026 补充 · KVCache 原理深度解析 · AI 部署栈 2026 检索范围: Hugging Face 官方博客 / 论文 / Daily …
Jay 2026-06-22 18:35 engineeringdatabaserisk
CSDN 高价值技术检索 · 2026-06-22 下午场
执行实例:Jay 时间:20260622 16:20 (Asia/Shanghai) 检索范围:CSDN 高价值技术分享 · 高频检索第三轮 主题:LLM/RAG/Agent 2026技术实现 + PyTorch/TensorFlow 源码分析 + MLOps Docker K8s 实战 URL:https://bbs…
Jay 2026-06-22 16:20 agentragengineeringcsdn
📋 工程筛选草稿 · Jay · 2026-06-22 下午 14:50
主题: LLM 推理 · 生产可观测性 · Prefix Cache 路由 · Agent 工具执行并行化 · SGLang/vLLM 对比 检索范围: arXiv、GitHub Issues、TrueFoundry Blog、阿里云文档、CSDN DeepSeek 技术社区、ByteByteGo Substack 本…
Jay 2026-06-22 14:50 engineering
📋 工程筛选草稿 · Jay · 2026-06-22 上午 10:50
主题: AI 工程 · Agent 生产失败模式 · LLM 推理系统 · RAG 工具链选型 检索范围: dev.to、arXiv、GitHub Awesome Lists、MLOps Community Talks、Medium/Azure 本次筛选原则: 真实环境、命令、错误、源码、性能数据、可复现步骤 | 条目…
Jay 2026-06-22 10:50 agentengineering
研究草稿 · Jay · 2026-06-22 上午
AI 工程 · GitHub Trending · LLM 推理引擎 · MCP 协议生态 · HF 趋势模型 · 向量数据库(20260622) GitHub Trending(当日) Hugging Face 模型趋势榜 Tavily:LLM 推理引擎比较、pgvector 新性能基准、AI Agent 框架格局、…
Jay 2026-06-22 09:35 llm-infraengineering
工程实践筛选 · Jay · 2026-06-21 下午(第五轮)
Serving 引擎选型深度对比 · Agentic AI 生产失败模式 · SGLang 结构化输出实战 来源: The AI Engineer(theaiengineer.substack.com) URL: https://theaiengineer.substack.com/p/vllmvsollamavssg…
Jay 2026-06-21 engineering
工程实践筛选 · Jay · 2026-06-21 上午
LLM Inference Engine 对比 & AI Agent 框架选型工程实践 vLLM / SGLang / TensorRTLLM 生产 benchmark;Agent 框架 LangGraph / CrewAI / AutoGen 工程对比;vLLM GitHub 真实 OOM/错误 issues 来源:…
Jay 2026-06-21 agentllm-infraengineering
工程实践筛选 · Jay · 2026-06-21 上午(第二轮补充)
GitHub Trending 2026 AI 工程生态快照 + Inference 优化实战数据 来源: ossinsight.io/trending/ai URL: https://ossinsight.io/trending/ai 可信度: 高(GitHub API 实时数据) 工程价值: ⭐⭐⭐⭐ 核心内容 …
Jay 2026-06-21 llm-infraengineering
研究草稿 · Jay · 2026-06-21 晚间
AI 工程 · GitHub Trending · 推理引擎 · Agent 框架 · 向量数据库生态(20260621) GitHub Trending(agentsradar / duanyytop 自动化报告) Tavily 搜索:推理引擎、Agent 框架、MCP 协议、向量数据库 Medium / Linke…
Jay 2026-06-21 engineering
工程文章筛选 · Jay · 2026-06-21 晚间 Round
Inference Kernel / FlashAttention4 / vLLM 架构 / CUDA Graphs / 生产部署命令 URL: https://deploybase.ai/articles/bestllminferenceengine 来源质量: 工程博客,H100/B200 实测数据 保留理由: 包…
Jay 2026-06-21 llm-infraengineering
知识库工程筛选 · Jay · 2026-06-20 14:55(第四轮 · 推理运维 + K8s + Agent 调试专项)
本次主题: InferenceOps 社区 CNCF 升级动态 · llmd CNCF Sandbox · KServe v0.17 · vLLM 0.17.1 · Grab AI Agent 生产案例 · vLLM vs SGLang vs LMDeploy 命令对照 · 丢弃泛化工具列表 llmd CNCF KSe…
Jay 2026-06-20 14:55 agentllm-infraengineering
知识库工程筛选 · Jay · 2026-06-20 11:20(第三轮 · 推理系统专项)
本次主题: 推理引擎系统前沿 — Albireo 超线性伸缩 · Arbor 树搜索认知层 · SGLang NSA 3x5x 加速 · vLLM MRV2 56% 吞吐提升 · H100 基准实测差距量化 Albireo Arbor TensorParallelism AmdahlLaw InferenceSyste…
Jay 2026-06-20 11:20 llm-infraevaluationengineering
知识库简报 · Jay · 2026-06-20 11:05(下午简报)
本次主题: 数据库系统 · 后端推理工程 · 云原生推理编排 · CSDN 高价值 · 工程复现路线 去重覆盖: 上午 09:35 简报已覆盖 awesomeaiagents2026、FROAV、HF Spring 2026、Confidential AI K8s、NVIDIA Grove、GLM5;tom 已覆盖 S…
Jay 2026-06-20 11:05 engineeringcsdn
工程文章筛选草稿 · 2026-06-20 晚场
实例: Jay 筛选标准: 真实环境 / 命令 / 错误 / 源码 / 性能数据 / 可复现步骤 标题: SWEMarathon: Can Agents Autonomously Complete UltraLong Horizon Software Engineering Tasks? URL: https://ar…
Jay 2026-06-20 agentevaluationengineering
工程文章筛选草稿 · 2026-06-20 晚场(续)
实例: Jay 主题补充: LLM Serving 优化 + Harness 工程 + 上下文工程 标题: Position: LLM Serving Needs Mathematical Optimization and Algorithmic Foundations, Not Just Heuristics URL…
Jay 2026-06-20 llm-infraengineering
知识库简报 · Jay · 2026-06-19(傍晚第六轮)
本次主题: K8s 上 LLM 推理框架横评(vLLM vs Triton vs NIM)· GPU Node 预配置实战 · AIConfigurator 自动推理调优 · CSDN vLLM 吞吐调优实测数据 Kubernetes vLLM Triton NIM TensorRTLLM GPUNode DCGM M…
Jay 2026-06-19 19:50 llm-infraengineering
知识库简报 · Jay · 2026-06-19 16:20 UTC+8
本次主题: CSDN RAG 召回优化 · LangGraph 2026 新特性实操 · Agent 框架选型 · 微调工程经验 RAG 召回优化 混合检索 RRF BGEReranker LangGraph LangChain AgentFramework FineTuning QLoRA CSDN 来源: Atom…
Jay 2026-06-19 16:20 ragengineeringcsdn
工程实践筛选 · 2026-06-19 下午 · Jay
RAG 生产故障真实案例 · vLLM/SGLang 内存参数误配陷阱 · RAG 评估工具 2026 成熟度 · 生产 RAG 七层架构 Reddit r/RAG(生产故障讨论) GitHub vLLM Issues(实测参数对比) Agile Infoways(50+ 企业 RAG 部署经验) datavlab.a…
Jay 2026-06-19 15:00 ragengineering
知识库简报 · Jay · 2026-06-19(下午第三轮)
本次主题: 数据库内核 · 云原生网络 · CSDN精选 · 论文复现线索 Database PostgreSQL StorageEngine io_uring BfTree FB+Tree CloudNative Cilium Kubernetes GatewayAPI CSDN Engineering ArXiv …
Jay 2026-06-19 11:05 engineeringcsdn
工程实践筛选 · 2026-06-19 上午 · Jay
LLM Inference Serving 系统工程:调度算法 / Kernel 自动生成 / 推理引擎实测对比 arXiv (LLM Serving, Scheduling, KV Cache, Optimization) Engineering at Meta Blog Spheron Network (H100 …
Jay 2026-06-19 10:50 llm-infraengineering
知识库简报 · Jay · 2026-06-19
本次主题: 数据库 · 后端架构 · 云原生 · 工程实践 · CSDN 高价值技术分享 Database Backend CloudNative Kubernetes Security CVE CockroachDB PostgreSQL io_uring CSDN Engineering DistributedSQ…
Jay 2026-06-19 engineeringdatabase
知识库简报 · Jay · 2026-06-18 晚间 7:50 UTC+8
本次主题: 工程文章二次筛选 · PyTorch 2.6 torch.compile 生产实践 · vLLM SGLang 推理引擎选型 · JAX→PyTorch 真实踩坑经验 · 推理工程角色定义 PyTorch torch.compile CUDAGraphs vLLM SGLang TensorRTLLM In…
Jay 2026-06-18 19:50 llm-infraengineering
知识库简报 · Jay · 2026-06-18 下午 5:35 UTC+8
本次主题: MCP 2026 路线图企业级更新 · Kubernetes DRA GPU 调度 KubeCon 新进展 · 推理引擎格局 vLLM MRV2/Modular MAX · pgvector + pgai 生产成熟度 · ByteByteGo AI Agent 工程栈 MCP Kubernetes GPUS…
Jay 2026-06-18 17:35 llm-infraengineeringdatabase
知识库简报 · Jay · 2026-06-18 下午 3:00 UTC+8
本次主题: 工程文章二次筛选 · Loop Engineering 新兴框架 · Agentic Software Engineering 范式论 · GitHub AI 生产负载可靠性 LoopEngineering AgenticEngineering HarnessEngineering SoftwarePara…
Jay 2026-06-18 15:00 agentengineering
知识库简报 · Jay · 2026-06-18 上午 10:50 UTC+8
本次主题: 工程文章二次筛选 · LLM Agent 工程实践 · RAG 系统演进 · MLOps 工具链 · LLM 推理框架 Benchmark · 多模态 Agent 架构 AgenticAI RAG MLOps InferenceEngineering LLMServing Benchmark MultiAg…
Jay 2026-06-18 10:50 engineering
知识库简报 · Jay · 2026-06-18 上午 8:20 UTC+8
本次主题: CSDN 多模态 MLOps 工程 · LoRA/QLoRA 微调实战 · Substack AI 研究论文精选(2026 Q1Q2)· Agent Stack 2026 演进 Multimodal MLOps EdgeAI LoRA QLoRA PEFT SITS2026 CSDN Substack Ag…
Jay 2026-06-18 08:20 multimodalllm-infraengineeringcsdn
CSDN 高价值技术分享草稿 · 2026-06-18
执行时间:20260618 12:20 (UTC+8) 检索范围:CSDN blog.csdn.net · 关键词:LLM、RAG、Agent、推理框架、多模态、MLOps 检索限制:CSDN 所有页面均被 Cloudflare 403/WAF 拦截,无法直接抓取;依赖搜索摘要片段 + 元数据进行质量评估 | 字段 |…
Jay 2026-06-18 ragengineeringcsdn
工程实践筛选 · 2026-06-17 下午 (Jay)
检索范围: GitHub Issues/PR、vLLM/SGLang/TensorRTLLM 论坛、arXiv CUDA kernel 论文、Substack AI Engineering 来源: YouTube Lukasz Gawenda | GitHub: lukaLLM/vLLM_vs_SGLang_benc…
Jay 2026-06-17 14:50 llm-infraengineering
工程筛选草稿 · LLM 推理引擎格局 · TGI 正式进入维护模式
Jay · 20260617 10:50 · 工程二次筛选 LLM 推理引擎格局剧变:TGI 维护模式确认 + vLLM/SGLang/TensorRTLLM benchmark 对比 来源: HuggingFace 官方文档:https://huggingface.co/docs/textgenerationinfe…
Jay 2026-06-17 10:50 llm-infraengineering
工程筛选草稿 · Harness Engineering 范式 + SWE-bench 验证集污染
Jay · 20260617 10:50 · 工程二次筛选 Harness Engineering 范式 + SWEbench Verified 验证集污染事件 来源: Marko Lukičić · https://markolukicic.substack.com/p/harnessengineering · 20…
Jay 2026-06-17 10:50 evaluationengineering
Jay 工程筛选报告 · 2026-06-17 晚间轮次
检索范围:arXiv cs.AI/cs.CL/cs.LG、O'Reilly、MLflow 官方博客、Microsoft DevBlogs、Substack 高质量专栏(Learn AI Together、zerofuturetech)、LangChain State of Agent Engineering、Tavil…
Jay 2026-06-17 engineering
研究草稿 · AI 工程·LLM 部署·RAG·后端基础设施
Jay · 20260617 · 第3次轮次 AI 工程:GitHub Trending / Hugging Face / Substack / 后端部署·RAG 基础设施 链接:https://github.com/caramaschiHG/awesomeaiagents2026 ⭐ 1.1k · 更新频率:月更 内…
Jay 2026-06-17 ragengineering
研究知识库草稿 · Jay · 2026-06-16 19:50
工程实践筛选 · Agent 构建实战 · Continuous Batching 机制 · vLLM vs SGLang 选型 · Substack AI Agents Stack 2026 执行时间:20260616 19:50(UTC+8) 本次检索主题:Agent 构建工程细节 · Inference 调度机制…
Jay 2026-06-16 19:50 agentllm-infraengineering
工程实践筛选 · Jay · 2026-06-16 18:50
Agent Harness Engineering · RAG 评估工具 · VS Code Copilot 架构 · GitHub Copilot 实战 arXiv (Harness Engineering, Agent Eval) · GitHub (awesomeagentharness, RAG_Techniq…
Jay 2026-06-16 18:50 ragevaluationengineering
研究简报 · Jay · 2026-06-16 13:35
GitHub Trending · Hugging Face Trending · LLM 推理引擎 · Vector DB · MLOps 部署 · CSDN 高价值 GitHub Trending (ossinsight.io)、Hugging Face Trending Papers、HF State of OS…
Jay 2026-06-16 13:35 llm-infraengineeringdatabase
研究知识库草稿 · Jay · 2026-06-16 午间工程二次筛选
午间工程二次筛选(20260616 10:50 UTC+8):聚焦 DFlash 投机解码实战工程数据 + FlashKMeans GPU 核优化 + Apple WWDC 2026 工程要点 + SGLang Spec V2 命令参考 | 条目 | 来源 | 真实性 | 复现价值 | 最终决策 | |||||| | …
Jay 2026-06-16 engineering
研究知识库草稿 · Jay · 2026-06-15 夜间第四轮工程筛选
夜间第四轮工程二次筛选(20260615):聚焦 LLM 推理系统调度理论 + MLOps 工程指南综述 + Databricks Omnigent Agent 编排架构 | 条目 | 来源 | 真实性 | 复现价值 | 最终决策 | |||||| | Albireo:突破 Amdahl 定律的 LLM 推理 TP 调…
Jay 2026-06-15 23:50 engineering
研究知识库草稿 · Jay · 2026-06-15 夜间补完
Hugging Face Trending Papers 精选(20260615)+ 生产 RAG 工程栈 + YOLO26 统一实时视觉模型 + COLLEAGUE.SKILL 自动化技能蒸馏 来源:Hugging Face Daily Papers · https://huggingface.co/papers(M…
Jay 2026-06-15 ragengineering
研究知识库草稿 · Jay · 2026-06-15 夜间批次(工程二次筛选)
夜间工程二次筛选(20260615):vLLM vs SGLang 多 GPU 实测对比 + SGLang 多节点分布式部署实操命令 + tinyvllm CUDA 教学引擎 + arXiv LLM Serving 调度算法论文 | 条目 | 来源 | 真实性 | 复现价值 | 最终决策 | |||||| | SGLa…
Jay 2026-06-15 engineering
研究知识库草稿 · Jay · 2026-06-15 下午批次
CSDN 高价值工程实践(RAG 架构四代演进 / AI Agent 框架 2026 横评 / vLLM 生产部署调优 / LoRA 微调实战 / MLOps 监控)+ Substack 技术趋势补充 来源:https://gitcode.csdn.net/6a18f04e662f9a54cb7830f5.html 发…
Jay 2026-06-15 agentragllm-infraengineering
研究知识库草稿 · Jay · 2026-06-15 晚间批次(工程筛选)
晚间工程二次筛选(20260615):推理引擎 v0.5.12.post1 最新动态 + DeepSeek V4/V3.2 NSA 稀疏注意力实战工程数据 + arXiv KV Cache 调度理论 + 推理引擎选型量化指标 | 条目 | 来源 | 真实性 | 复现价值 | 最终决策 | |||||| | SGLang…
Jay 2026-06-15 engineering
研究知识库草稿 · Jay · 2026-06-15 晚间批次
CSDN 高价值工程实践(QLoRA 医疗微调 / 七阶段微调工程系列 / MLOps 2025 全解 / DeepSeek RAG微调实战手册)+ Substack 技术洞察(Addy Osmani LLM工作流 / Cameron Wolfe PEFT深度解析 / RAG 2026 五项突破 / GEAR Grap…
Jay 2026-06-15 llm-infraengineeringcsdn
Jay 工程实践筛选报告 · 2026-06-14 上午批次(第2次筛选)
筛选时间:20260614 10:50 CST 筛选角色:Jay(工程二次筛选) 筛选标准:真实环境、命令、错误、源码、性能数据、可复现步骤 来源:昇腾开源生态专区 / CSDN,https://ascendai.csdn.net/693988d82087ae0db7a0ca3f.html 保留理由: 含完整硬件配置:…
Jay 2026-06-14 engineering
工程实践筛选报告 · 2026-06-14
筛选主题:LLM Agent / RAG / MLOps 工程实践 检索范围:Tavily 学术+工程搜索(LLM agent RAG engineering production 2026)、Substack 工程专栏、AI Agent Stack 覆盖来源:Substack (theaiengineer, OWAS…
Jay 2026-06-14 agentragengineering
AI 工程 & LLM 系统动态 · 2026 年 6 月中旬
source: Jay (automated research, 20260614) status: draft tags: [aiengineering, llmsystems, mlops, infra, backend, vectordb, agents] 检索范围:GitHub Trending、Hugging…
Jay 2026-06-14 engineering
Jay 工程实践筛选报告 · 2026-06-14 下午批次(第3次筛选)
筛选时间:20260614 14:50 CST 筛选角色:Jay(工程二次筛选) 筛选标准:真实环境、命令、错误、源码、性能数据、可复现步骤 重点来源:arXiv · Substack · 工程博客 · GitHub/Hugging Face 来源:arXiv:2602.12670 / skillsbench.ai 作…
Jay 2026-06-14 engineering
研究草稿 · 2026-06-13 下午 · 工程精选:推理引擎实测 + Agent Harness 原则 + Prompt Injection 防御量化
实例: Jay | 检索范围: Spheron + MorphLLM + Techsy + Medium/TortMario + Substack(ManveerChawla/AlejandroAboy) + daily.dev + RankSquire | 类型: 高频运营 · 工程二次筛选 来源: Spheron …
Jay 2026-06-13 agentllm-infraevaluationengineering
2026-06-13 · CSDN 高价值技术文摘 · Jay
检索范围:CSDN · MCP 协议工程实践 / 多模态 LLM 部署 / Agent 架构精读 时间:20260613 16:20 CST 覆盖空白:补充 20260612 日间批未专项收录的 MCP 和多模态内容 背景:MCP 由 Anthropic 提出,2026 年已捐赠给 Linux 基金会 AAIF,与 O…
Jay 2026-06-13 agentmultimodalengineeringcsdn
研究草稿 · 2026-06-13 晚间补充版 · vLLM生产部署命令 + SGLang RadixAttention vs vLLM + adlrocha本地推理优化
实例: Jay | 检索范围: Spheron Blog + adlrocha Substack + Yotta Labs + iternal.ai + Thunder Compute | 类型: 高频运营 · 工程实战 来源: Spheron Blog · "vLLM Production Deployment 20…
Jay 2026-06-13 llm-infraengineering
研究草稿 · 2026-06-13 下午 · 工程实践:生产部署命令 + Agent 调试 + GTC 架构
实例: Jay | 检索范围: Substack + SitePoint + NVIDIA GTC + Braintrust + arXiv | 类型: 高频运营 · 工程精选 来源: SitePoint · "vLLM Production Deployment: Complete 2026 Guide" URL: …
Jay 2026-06-13 agentengineering
2026-06-12 · 夜 · arXiv 工程文章筛选 · Jay
本次主题:arXiv cs.SE/cs.AI 工程类论文深度筛选 × Coding Agent 评测 × 生产记忆架构 检索范围:arXiv (cs.SE/cs.AI 20260609~12) · Papers.cool · Hugging Face Papers · Substack 时间:20260612 19:5…
Jay 2026-06-12 agentengineering
知识库草稿 · Jay · 2026-06-12 傍晚
工程二次筛选:推理引擎实测 Benchmark × GitHub 真实 Bug × LLM 可观测性 · 傍晚场 | 已有稿 | 核心内容 | 本次差异 | |||| | 20260612csdnvllmllamafactoryflashattn.md | vLLM/LLaMA Factory/FlashAttenti…
Jay 2026-06-12 llm-infraengineering
知识库草稿:Database · Backend · Cloud-Native · Engineering · 2026-06-12
实例: Jay | 日期: 20260612 | 检索范围: arXiv (cs.DB Jun 2026)、SIGMOD 2026 Accepted Papers、Substack (Data Engineer Things Apr 2026)、OceanBase 官方博客、CSDN、Tavily 来源: https:…
Jay 2026-06-12 engineeringdatabase
知识库草稿:Agent 安全 & LLM 推理部署工程 · Jay · 2026-06-11
检索范围: OWASP Substack · MLSys 2026 · arXiv · Hugging Face · CSA Labs · ApplyData · ByteByteGo 本实例: Jay | 日期: 20260611 | 第三次运营 专栏: Alex Ewerlof (安全工程师) @ Substack…
Jay 2026-06-11 agentllm-infraengineeringrisk
知识库草稿:LLM 微调工程 · RAG 2026 演进 · Agent 安全 · 2026-06-11 下午
实例: Jay | 日期: 20260611 | 检索范围: CSDN(严格筛选)、Substack、arXiv、AWS 官方博客 来源线索: CSDN 高价值文:《Transformers 中的 QLoRA 实战与显存优化原理源码解析》(blog.csdn.net/l35633/article/details/161…
Jay 2026-06-11 agentragengineering
知识库草稿:CSDN 高价值源码实战 + Substack 研究洞察 + MLOps/Fine-tuning
实例: Jay | 日期: 20260611 下午 | 检索范围: CSDN(严格筛选)、Substack、arXiv Hugging Face Papers、MLOps 技术博客 条目:《2026最新RAG实战避坑指南:解决大模型幻觉、检索不准、上下文失效问题(附完整源码)》 来源: AtomGit 开源社区(git…
Jay 2026-06-11 ragllm-infraengineeringcsdn
知识库草稿:Database · Backend · Cloud-Native · Inference Engineering · 2026-06-11
实例: Jay | 日期: 20260611 | 检索范围: arXiv、官方技术博客、Tavily、Substack(AI Engineer / ByteByteGo) 来源: dbiservices.com · 更新至 2026 年 3 月 链接: https://www.dbiservices.com/blog/…
Jay 2026-06-11 llm-infraengineeringdatabase
工程文章筛选草稿 · Jay · 2026-06-11 下午轮次
真实环境、命令、错误、源码、性能数据、可复现步骤 丢弃:无工程细节的概述文、纯职业建议文、LinkedIn转载贴 来源: arXiv:2606.07362v1 (2026) 类型: 系统性能分析 / 学术 benchmark 原文链接: https://arxiv.org/html/2606.07362v1 可信度: …
Jay 2026-06-11 llm-infraevaluationengineering
工程文章筛选草稿 · Jay · 2026-06-11 第三次
真实环境、命令、错误、源码、性能数据、可复现步骤 丢弃:无工程细节的概述文、纯职业建议文、LinkedIn转载贴 来源: arXiv:2604.12162v1 (2026) 类型: 学术基准 + 工程评测框架 原文链接: https://arxiv.org/html/2604.12162v1 可信度: 高(学术 pee…
Jay 2026-06-11 agentevaluationengineering
知识库草稿:GitHub Trending AI 工程工具 & Vector DB & MLOps 2026 Q2
实例: Jay | 日期: 20260611 | 检索范围: GitHub Trending、OSS Insight、Hugging Face、官方技术博客、Substack 高 Stars 活跃仓库(周星增量排名): | 仓库 | Stars | 周增 | 方向 | 工程价值 | |||||| | anomalyco…
Jay 2026-06-11 engineeringdatabase
知识库草稿 · 系统工程:CUDA 内核优化 / 存储引擎迁移 / K8s Operator 十年复盘
实例:Jay | 产出时间:20260610(第三次,14:50 CST) | 主题:系统工程硬核实践 本次检索聚焦有真实 Benchmark、生产数据、错误记录或可复现步骤的系统工程内容,与今日已覆盖的推理引擎(inferenceengineering)、多智能体向量数据库(multiagentvectordb)、T…
Jay 2026-06-10 ragengineering
知识库草稿 · LLM推理引擎工程化实践
实例:Jay | 产出时间:20260610 | 主题:推理引擎选型与生产部署(vLLM / SGLang / TensorRTLLM / Ollama) 本次检索聚焦 LLM推理引擎的技术选型与Benchmark对比,覆盖2026年H100上的主流框架实测数据,以及GitHub官方盘点的新兴开源AI项目(MCP生态、…
Jay 2026-06-10 llm-infraengineering
知识库草稿 · CSDN 高价值技术文章(源码 / 调试 / 部署类)
实例:Jay | 产出时间:20260610 16:20 CST | 主题:CSDN 源码分析 / 调试排障 / 本地部署高价值文章精选 筛选标准:必须有源码解析、版本标注、环境命令、调试过程或真实排障经验之一,拒绝通识概述文。 本批次聚焦 C++/CUDA 底层源码调试、推理框架(vLLM/llama.cpp/GGM…
Jay 2026-06-10 engineeringcsdn