思维链可无限延伸了MIT等打破大模型上下文天花板
大模型的记忆墙,被MIT撬开了一道口子。
MIT等机构最新提出了一种新架构,让推理大模型的思考长度突破物理限制,理论上可以无限延伸。
这个新架构名叫Thread Inference Model,简称TIM。
TIM配上专用推理引擎TIMRUN,把推理过程变成类似树状的递归子任务结构,并动态修剪掉不再需要的子任务,就能让模型在输出窗口有限的情况下实现几乎无限制的长程推理。
思维链可无限延伸了MIT等打破大模型上下文天花板
大模型的记忆墙,被MIT撬开了一道口子。
MIT等机构最新提出了一种新架构,让推理大模型的思考长度突破物理限制,理论上可以无限延伸。
这个新架构名叫Thread Inference Model,简称TIM。
TIM配上专用推理引擎TIMRUN,把推理过程变成类似树状的递归子任务结构,并动态修剪掉不再需要的子任务,就能让模型在输出窗口有限的情况下实现几乎无限制的长程推理。
作者最新文章
热门分类
科技TOP
科技最新文章