AI时代下弄潮儿的思考-- 避免变成“AI 驱动的低水平勤奋” AI 这么强,人与人之间的差距到底在哪里?最近看到一篇很有意思的文章:《我把13个顶级AI送去数学高考,并列第一居然是它们。。。》。 文章把几个主流 AI 模型拿去做高考数学卷。结果并不意外:头部模型已经非常强,很多难题都能做,甚至能拿到接近顶尖学生的分数。 这件事让我想到一个问题: 如果简单题 AI 会做,难题 AI 也会做,那以后人与人之间的差距到底体现在哪里? 高考还能筛人,一个很重要的 2026-06-09 Report #关于人与人之间的思考
AriGraph_ Learning Knowledge Graph World Models with Episodic Memory for LLM Agents 发表时间:202407 会议/期刊:IJCAI 作者:Petr Anokhin Russia 论文链接:https://arxiv.org/pdf/2407.04363 代码/数据集链接: Tag: ABSTRACTllm 的先进能力已经创造了一个坚实的地基为发展全自动化 agent。有了正确的 tools,这些 agents 能够学习解决环境中遇到的任务通过积累和更新他 2026-06-08 papers #KG #结构化记忆
GRAPHMIND_ LLMS AS DYNAMIC KNOWLEDGE BUILDERS FOR SEQUENTIAL DECISION-MAKING Graphmind:llm 作为一个动态的知识构建者对于时序决策制定 发表时间:ICLR 2026 作者:Yutong Li 论文链接:https://openreview.net/pdf?id=XromAiEaE3 代码/数据集链接:https://anonymous.4open.science/r/GraphMind-1080 Tag: ABSTRACT当前 llm 有了强大的 2026-06-08 Papers #KG #动态决策制定
Paper Writing Skills Deepseek researcher(Deli chen) has open source his AuroResearch Skills. He use this skills published three papers that has citated 941 times. Let’s talk about it. Link: paper: https://victorchen96.gi 2026-06-08 Report #skills #paper writing
Skills-SD_ Skill-Conditioned Self-Distillation for multi-turn LLM Agents 发表时间:202604 会议/期刊:arxiv 作者:hao wnag CAS 源码:https://skill-sd.github.io/ Tag: ABSTRACTRL has been widely used to tarin llm agents for multi-turn interactive tasks, but its sample effciency is se 2026-06-08 Papers #Agent #自进化
SYMPHONY_ Synergistic Multi-agent Planning with Heterogeneous Language Model Assembly SYMPHONY:多智能体协同规划使用多样的大语言模型集群 发表时间:202601 会议/期刊:Neurips 2026 作者:Wei Zhu Yunnan University 论文链接:https://arxiv.org/pdf/2601.22623 代码/数据集链接: Tag:Multi-Agent;Agent Planning ABSTRACT现在使用 llm 构 2026-06-08 Papers #多智能体
2026-Pwn2Own Key Notes: In Pwn2Own Berlin, researchers found unique 0 day across ten targets categories, with payouts totaling US$1,298,250, a new event record AI sub-categories(coding Agents, Local Inference, AI 2026-06-03 Report #Pwn2Own
ATT&CK to CVE_ A Large-Scale Automated Knowledge Graph for Threat Intelligence 摘要Cyber threat intelligence(CTI)包括收集和分析安全相关的信息通过多元化和参差的。这些信息可能包含整理不同格式、详略程度各异的漏洞、缺陷以及攻击模式相关数据的 repo。分析者必须持续调整这些源文件去增加一个连贯的视角进化威胁形式,然而这些进程通常是手动的,不完整的并且易于出错的。在这个工作中,我们提出了一个完全自动化的网安知识图谱流程,系统化的提取和规范数据从 NV 2026-05-01 Papers #paper #Knowledge Graph
LLM-BASED MULTI-AGENT BLACKBOARD SYSTEM FOR INFORMATION DISCOVERY IN DATA SCIENCE 聚焦多 Agent 共享图/黑板、动态状态/任务图 文章比较老了,感觉投了好几轮了,文中使用的还是 gemini2.5 摘要LLM 的快速发展在数据科学开启了新的大门,然而他们实际的部署通常是约束的在大型数据池中查找相关数据的挑战。现有的方法与以下斗争:单 agent 系统被大的目标快速淹没,混杂的文件在数据池中,然而多 agent 系统设计基于主从式的范式依赖一个需要精确每一 2026-05-01 Papers #paper #MULTI-AGENT #blackboard
KRYSTAL_ Knowledge graph-based framework for tactical attackdiscovery in audit data KRYSTAL: 基于图谱的知识框架审计数据对于策略攻击发现 摘要:基于图谱的攻击方法是有希望的方法对于发现攻击和多样的技术最近变得提议。一个关键的限制,然而,到目前为止方法是先进的,巨大的在他们的架构和参差的在他们的模型中。现有的死板的定制化数据模型和代码中的规则执行,而不是陈述性的语言一方面导致它困难的去合并、拓展和复用技术,另一方面阻碍安全知识复用(包括规则检测和威胁情报)。KRYSRAL 2026-05-01 Papers #Knowledge Graph
REPOGRAPH:Enhancing AI software engineering with repository-level code graph 全篇没公式都,完整方法论 2 页 REPOGRAPH 先把代码仓库变成一张“函数/类/调用关系图”,然后根据 issue 里的关键词找出相关子图,把这些结构化上下文喂给 LLM,帮助它更准地定位和修改代码。 摘要:llm 在代码生成领域出色,但是在现代 ai 软件工程任务中还困难。不想传统的函数级别或者文件级别的 coding 任务,ai 软件工程不但需要基础的 coding 2026-05-01 Papers #Agent #LLM #code graph
Can LLM Prompting Serve as a Proxy for Static Analysis in Vulnerability Detection LLM 提示能否作为漏洞检测中静态分析的代理1.介绍:该策略将漏洞的自然语言描述与对比思路链推理方法相结合,并使用来自合成数据集的对比样本进行增强。我们的研究通过将自然语言描述、对比推理和合成示例集成到一个综合提示框架中,突出了 LLM 检测漏洞的潜力。我们的结果表明,这种方法可以增强 LLM 对漏洞的理解。在 SVEN 等高质量漏洞检测数据集上,我们的提示策略可以分别将准确度、F1 分数和成对准 2026-05-01 Papers #LLM #paper #Static Analysis
Repository-Level Graph Representation Learning for Enhanced Security Patch Detection Abstract软件供应商通常默默的发布安全补丁,不提供任何建议或者延期更新资源。然而,检测安全补丁是必要的去确保软件安全维护。然而,现有的方法面对以下挑战:1.他们主要针对有 patch 的信息,忽略了 repo 中复杂的依赖 2.安全补丁通常涉及多种的函数和文件,加大了有效学习表征的难度。为了缓和这些挑战,这篇文章提出 了 repo 级别的安全补丁检测框架,名为 RepoSPD,包括三个关键部 2026-05-01 Papers #Patch Detection #Repo-level #Graph Representation Learning
THINK-ON-GRAPH DEEP AND RESPONSIBLE REASON-ING OF LARGE LANGUAGE MODEL ON KNOWLEDGEGRAPH 摘要:尽管大模型已经实现了巨大的成功在多样的任务中,他们经常面临幻觉问题,尤其是需要深入和负责推理的场景。这个问题能被部分解决通过引进外部的知识图谱在 llm 推理中。在这篇文章,我们提出了一个新的 LLM-KG 集成范例“LLM ⊗ KG”这个范例看作 llm 作为一个 agent 交互式的拓展相关字符实体和关系在 kg 上,并且执行推理基于补偿知识。我们进一步执行这个范例通过引入一个新的方法称 2026-05-01 Papers #LLM #paper
Toward a Knowledge Graph of Cybersecurity Countermeasures 摘要这个文章描述了我们的方法和发展关于精确的、无歧义的、信息密集型的网络安全应对措施知识图谱。在面向合作方开展项目的工作中,我们反复遭遇一个需求,需要一个模型能够识别和精确界定网络安全应对措施组成部分与各项功能。此外,从业者不仅需要知道某项功能声称能够应对哪些威胁,而且特别注意这些威胁怎么样被化解从一个工程观点,以及这个解决方案在什么状态下会生效。这个知识是必要的去评估操作的可行性,漏洞点,和发展 2026-05-01 Papers #Knowledge Graph
腾讯第二界agent漏挖 排名:天翼安全-Sniper 水滴实验室 Cairn AI 个人选手 没接 skills、没 mcp、定义了一个任务图,agent 来维护这个图, 中国电信没用 claude、codex,使用了 react 框架 2026-04-01 Report #Agent #腾讯
The formexeCommand function in Tenda's i12 product has a stack overflow InformationVendor: Tenda Product: i12 Vulnerability: buffer overflow Version: V1.0.0.6(2204) Firmware Download: https://www.tenda.com.cn/material/show/2483 DescriptionsWe found an overflow vulnerabili 2026-02-28 Report #CVE提交 #Buffer overflow
The formwrlSSIDget function in Tenda's i12 product has a stack overflow InformationVendor: Tenda Product: i12 Vulnerability: buffer overflow Version: V1.0.0.6(2204) Firmware Download: https://www.tenda.com.cn/material/show/2483 DescriptionsWe found an overflow vulnerabili 2026-02-28 Report #CVE提交 #Buffer overflow
The formWifiMacFilterGet function in Tenda's i12 product has a buffer overflow InformationVendor: Tenda Product: i12 Vulnerability: buffer overflow Version: V1.0.0.6(2204) Firmware Download: https://www.tenda.com.cn/material/show/2483 DescriptionsWe found an overflow vulnerabili 2026-02-28 Report #CVE提交 #Buffer overflow
cve2-FH1202-bufferoverflow FH1202 VulnerabilityVendor:TendaProduct:FH1202 (download:https://www.tenda.com.cn/download/detail-2079.html)Vulnerability: buffer overflow DescriptionsWe found an overflow vulnerability in httpd :In f 2026-02-15 Report #CVE提交 #Buffer overflow