AI 工作流最新最利之器

真的假的

豆包语音输入法

这个东西不亚于当初发现 Claude Code 的震撼之处。听着真的很土，但真的好用。

之前做 vibe coding 最大的 bottleneck 是打字速度。假如我要 multi-tasking，开好几个 sessions——一边做人文社科的 final proposal，一边做其他几个 project——眼睛勉强能跟得上，但我没有办法三只手同时输出。我打字算快的，但永远满足不了多个窗口的 prompt 输出需求。

现在按住 FN 键就直接说话，输入速度比打字提升了大概五倍，输入准确率几乎达到了无敌的水平，我平时还是会中英文混杂输入的，为数不多的错误基本来源于我的单词不标准。除此之外没有额外的大错误了。苹果自带的语音输入几乎不可用，导致我之前完全没挖掘到这一块的便捷。

唯一注意的是，毕竟语音还是在字节跳动服务器处理的，写一写Prompt就可以了，要是输入一些其他隐私一点的东西可能不太适合。

从 20 分钟到 3 分钟

大概聊了 3 分钟，Word 文档就显示了七百多字。按之前的经验，思维不卡壳的前提下，写六七百字的文章需要 20 多分钟。现在只花了 3 分钟就把想说的全说完了。与此同时，我的Kiro正在帮我想一个人文社科课的final proposal，我的Codex正在做数据挖掘的作业，我的CC正在做CI/CD。

当然，输出都是口语化的表述，后续需要花时间 fine-tuning。但无论如何，心理负担少了非常多——当你已经看到一个成品，修改它的欲望比从零开始写的压力小太多了。唯一的缺点是要找一个能够自由说话的环境，图书馆可能不太适合，但是在家就非常爽了。

Vibe Coding 的代价

到了这个学期，我手写代码就只有在面试手撕 LeetCode 的时候写过几行。除此之外，我没有写过任何一行代码。

我不知道这是一个能力的退化，还是一种范式的转移。总感觉 coding 本身给我的反馈变少了一点——没有之前写 Java debug 了很久，然后 click 一下跑通的那种爽感了。可能会让人比较急功近利吧，但很显然，我们已经没有回到之前那个时代的心气和耐心了。

前两个月投了一堆暑期实习，终于中了一个offer。不知道这个厂算是大厂还是算中厂，但是风评还算不错。我投递的那个岗位据说里面在写Kotlin为主，说实话，我对Kotlin以及安卓架构确实不熟，但我一点都不慌。我还是非常期待进入工业界看一看，现在AI Agents到底是如何被用在真正的工作中的吧。

Stay tuned for more updates!

AI 工作流最新最利之器

豆包语音输入法

从 20 分钟到 3 分钟

Vibe Coding 的代价

CATALOG

FEATURED TAGS