在做毕设的多模态大模型微调时,我遇到了一个很奇怪的问题:模型明明已经给出了正确回答,却会在正确回答后紧接着输出一大段乱码。
经探索发现:这一问题的根源是结尾符(EOS Token)的输出问题。大语言模型的推理以自回归概率输出为基础,判断回答结束的方法也是识别到输出结果中的结尾符,而Qwen base模型的微调过程中正会出现与之相关的问题,导致了本文所述现象的发生。本文将探讨这一问题的原因和解决方案。
在做毕设的多模态大模型微调时,我遇到了一个很奇怪的问题:模型明明已经给出了正确回答,却会在正确回答后紧接着输出一大段乱码。
经探索发现:这一问题的根源是结尾符(EOS Token)的输出问题。大语言模型的推理以自回归概率输出为基础,判断回答结束的方法也是识别到输出结果中的结尾符,而Qwen base模型的微调过程中正会出现与之相关的问题,导致了本文所述现象的发生。本文将探讨这一问题的原因和解决方案。
在最后一届运动会雨后的那个傍晚,如同指尖划过水雾附着的琉璃一般,时间的流动轻缓而难以感知。
“AI Agent编写代码+人工审阅批准”的Vibe Coding流程,已经逐渐成为了我日常工作流中极其重要的一部分,然而吃饭、睡觉、外出活动的间隙,仍然不可避免地要离开电脑屏幕前。俗话说打工人得休息,但AI Agent却是可以在后台替我们完成工作、推进进度的。如何填补这一空缺,让我们不在屏幕前时也能监控、审阅本地电脑的Agent的工作结果,并进一步发出指令?
在学界业界,为解决这一问题,Claude Code、Codex等都纷纷拥抱命令行(Cli)化,也出现了happy等开源项目为其提供手机端和Web端。但就我的日常工作流而言,审阅代码、文件仍然占一大部分,因此仍然依赖Cursor这样的IDE内置AI Agent。Cursor Cli推出后,通过手机端操控本地PC的Cursor AI Agent成为了可能,本篇文章记录实现这一思路的探索历程。
最近看了电影《列夫·雅辛——梦想守门员》。作为一名业余门将,日常比赛乃至于正式的大乙联赛中,教练都鼓励我们在求稳的前提下,大胆出击、敢于破坏球。门线技术之外,门将前提基础占位、提前出击大胆破坏直塞球、高空球,是近代、现代门将的必修课。而作为近代门将之父,前苏联门将列夫·雅辛是我么榜样。他既是唯一的金球奖门将,又是近代门将技术的“启发者”,但在网络上却资料甚少,令人为之好奇。