当前大模型技术采用自注意力机制的Transformer架构,在与其它深度学习架构的共同发展中,呈现出“大道至简”“万法归一”的演化态势,主导了人工智能从“专用”走向“通用”的历史进程。本报告梳理Transformer架构的演化趋势,并探讨在统一架构下大模型的幻觉消除和认知对齐问题。
人工智能
吴文峻