豆包语音输入法
这个东西不亚于当初发现 Claude Code 的震撼之处。听着真的很土,但真的好用。
之前做 vibe coding 最大的 bottleneck 是打字速度。假如我要 multi-tasking,开好几个 sessions——一边做人文社科的 final proposal,一边做其他几个 project——眼睛勉强能跟得上,但我没有办法三只手同时输出。我打字算快的,但永远满足不了多个窗口的 prompt 输出需求。
现在按住 FN 键就直接说话,输入速度比打字提升了大概五倍,输入准确率几乎达到了无敌的水平,我平时还是会中英文混杂输入的,为数不多的错误基本来源于我的单词不标准。除此之外没有额外的大错误了。苹果自带的语音输入几乎不可用,导致我之前完全没挖掘到这一块的便捷。
唯一注意的是,毕竟语音还是在字节跳动服务器处理的,写一写Prompt就可以了,要是输入一些其他隐私一点的东西可能不太适合。
从 20 分钟到 3 分钟
大概聊了 3 分钟,Word 文档就显示了七百多字。按之前的经验,思维不卡壳的前提下,写六七百字的文章需要 20 多分钟。现在只花了 3 分钟就把想说的全说完了。与此同时,我的Kiro正在帮我想一个人文社科课的final proposal,我的Codex正在做数据挖掘的作业,我的CC正在做CI/CD。
当然,输出都是口语化的表述,后续需要花时间 fine-tuning。但无论如何,心理负担少了非常多——当你已经看到一个成品,修改它的欲望比从零开始写的压力小太多了。唯一的缺点是要找一个能够自由说话的环境,图书馆可能不太适合,但是在家就非常爽了。
Vibe Coding 的代价
到了这个学期,我手写代码就只有在面试手撕 LeetCode 的时候写过几行。除此之外,我没有写过任何一行代码。
我不知道这是一个能力的退化,还是一种范式的转移。总感觉 coding 本身给我的反馈变少了一点——没有之前写 Java debug 了很久,然后 click 一下跑通的那种爽感了。可能会让人比较急功近利吧,但很显然,我们已经没有回到之前那个时代的心气和耐心了。
前两个月投了一堆暑期实习,终于中了一个offer。不知道这个厂算是大厂还是算中厂,但是风评还算不错。我投递的那个岗位据说里面在写Kotlin为主,说实话,我对Kotlin以及安卓架构确实不熟,但我一点都不慌。我还是非常期待进入工业界看一看,现在AI Agents到底是如何被用在真正的工作中的吧。
Stay tuned for more updates!