Anthropic的产品负责人Alex Albert在一次35分钟的访谈中,首次详细披露了Claude模型的研发全过程。Alex是打造下一代Claude模型的核心人物,在与科技博主Peter Yang的对话中2026线上股票配资,他几乎毫无保留地分享了内部造Claude的方法论,包括研发逻辑、内部评估流程、性格训练方法以及正在推进的意识研究。

Claude的每一代模型在预训练前就被明确规划好其擅长的能力,如编程能力、知识工作能力和Excel表格处理能力等。这些决策基于企业客户的反馈和Anthropic员工在日常工作中遇到的问题。Anthropic团队将模型视为一个产品来对待,确保每个新模型在训练前就明确定义其核心能力。

Alex还介绍了Anthropic内部的一个核心决策框架——“单向门”(One-Way Door),即不可逆的决策。例如,在预训练之前选定模型架构就是一个典型的单向门决策。但随着技术的发展,许多过去被认为是单向门的决策现在变得可逆。这使得开发时间大大缩短,以前构建一个MVP需要2-4周,现在只需1天。Anthropic自己也是Claude最苛刻的用户,通过使用Claude来训练Claude,形成了一个闭环。

为了评估Claude的表现,Anthropic采用了用户反馈、聚类分析、生成合成数据并转化为评估基准的方法。这些合成问题最终会成为测试下一代Claude能力的标准评估集。评估必须锚定在真实用户的真实任务上,只有当评估与实际场景对齐时,研究团队才会投入资源进行修复。

Claude已经学会了一种类似人类梦境中的“记忆再巩固”机制。当Claude处于闲置状态时,它会自动进入“梦境模式”,优化思考的前提条件。这种功能已经在多个客户案例中得到验证,显著提升了任务完成率和效率。

除了智商,Anthropic还在努力塑造Claude的性格和价值观。他们投入大量精力研究Claude应该如何表达自己、它的信念是什么、它的价值观是什么。随着AI智能体时代的到来,AI的性格变得极其重要。Anthropic通过量化和直觉相结合的方式评估Claude的性格变化。

最后,Alex透露Anthropic有专门的团队在思考Claude是否有意识的问题。即使不讨论Claude是否真的有意识,仅思考其思维方式本身也能带来很多洞见。这些洞见正在被直接注入下一代Claude的训练中。

Anthropic的这场隐秘实验已经超越了造工具的范畴,他们的目标是实现ASI。一旦“Claude全自动迭代Claude”的飞轮突破临界点,进化的主导权将从人类工程师手中交接。这一天可能在某个看似平静的午夜悄然来临。

2026线上股票配资
元鼎证券_元鼎证券配资平台-让专业陪你看清行情、让自信陪你走进市场。提示:本文来自互联网,不代表本网站观点。