找到 94 篇文章

在做毕设的多模态大模型微调时，我遇到了一个很奇怪的问题：模型明明已经给出了正确回答，却会在正确回答后紧接着输出一大段乱码。

经探索发现：这一问题的根源是结尾符（EOS Token）的输出问题。大语言模型的推理以自回归概率输出为基础，判断回答结束的方法也是识别到输出结果中的结尾符，而Qwen base模型的微调过程中正会出现与之相关的问题，导致了本文所述现象的发生。本文将探讨这一问题的原因和解决方案。

最后一届运动会雨后的傍晚 | 毕设致谢碎片Part.1

在最后一届运动会雨后的那个傍晚，如同指尖划过水雾附着的琉璃一般，时间的流动轻缓而难以感知。

阅读全文...

手机端操控的本地PCAgent——基于Cursor Cli与ssh的实践

“AI Agent编写代码+人工审阅批准”的Vibe Coding流程，已经逐渐成为了我日常工作流中极其重要的一部分，然而吃饭、睡觉、外出活动的间隙，仍然不可避免地要离开电脑屏幕前。俗话说打工人得休息，但AI Agent却是可以在后台替我们完成工作、推进进度的。如何填补这一空缺，让我们不在屏幕前时也能监控、审阅本地电脑的Agent的工作结果，并进一步发出指令？

在学界业界，为解决这一问题，Claude Code、Codex等都纷纷拥抱命令行（Cli）化，也出现了happy等开源项目为其提供手机端和Web端。但就我的日常工作流而言，审阅代码、文件仍然占一大部分，因此仍然依赖Cursor这样的IDE内置AI Agent。Cursor Cli推出后，通过手机端操控本地PC的Cursor AI Agent成为了可能，本篇文章记录实现这一思路的探索历程。

阅读全文...

Perception | 《列夫·雅辛》近代门将之父

最近看了电影《列夫·雅辛——梦想守门员》。作为一名业余门将，日常比赛乃至于正式的大乙联赛中，教练都鼓励我们在求稳的前提下，大胆出击、敢于破坏球。门线技术之外，门将前提基础占位、提前出击大胆破坏直塞球、高空球，是近代、现代门将的必修课。而作为近代门将之父，前苏联门将列夫·雅辛是我么榜样。他既是唯一的金球奖门将，又是近代门将技术的“启发者”，但在网络上却资料甚少，令人为之好奇。

阅读全文...

Manueld

路上见识世界，途中认清自己

写给二十一岁

Qwen2.5模型微调 | 结尾符（EOS Token）的输出问题及其解决方案

最后一届运动会雨后的傍晚 | 毕设致谢碎片Part.1

手机端操控的本地PCAgent——基于Cursor Cli与ssh的实践

Perception | 《列夫·雅辛》近代门将之父