【转录】如何利用 ChatGPT 整理语音笔记:修正、改写、翻译与激发灵感

在探索AI在语音笔记应用中的角色时,我们发现“修正”、“改写”和“翻译”是其主要的功能。AI对个人的言语进行语音识别并将其修正,然后改写成更符合书面语的表达。然而,AI更深层次的角色在于将这些言语“翻译”成一种更多人能够理解的语言,使我们的思考得以深度记录和理解。此外,当处理成熟的知识内容时,AI也能在一定程度上扩展我们的想法并提供新的灵感。然而,对于较新或小众的内容,AI的灵感启发作用可能会受到限制。这些角色的存在使得AI在语音笔记中的应用变得更加丰富和多元,同时也给使用者带来了许多便利和新的思考方向。

我最近发现,很多人开始利用ChatGPT来整理语音笔记。我自己也在尝试使用,我发现在这个过程中,GPT 在我完成笔记任务的过程中实际扮演了三个角色:修正、改写和“翻译”。

修正:语音识别的错误纠正

举例来说,我曾经和朋友在腾讯会议讨论记笔记的话题。后面我使用通义听悟识别文稿,在这半小时的录音中,有不少词语的识别结果是错误的。这时候就是,GPT就发挥“修正”的作用,根据上下文修正语音识别结果中的错误。

例如,语音识别错误地将“笔记”识别为“必记”,ChatGPT可以根据上下文纠正这一错误。

改写:口语转化为书面语

再说“改写”,同样是这份识别文稿,我发现有不少句子和段落的表述包含口僻和非常口语化的表达。这时候,我可以使用GPT,把这些口头表达改写为更为正式、规范的书面版本。

例如,将“这个东西挺好用的”改写为“该产品具有显著的使用效益”。

翻译:个人言语转化为共享语言

至于“翻译”,我会把我的发言内容提交给GPT,让它把我的“言语”转化为“语言”。GPT可以帮助我将个人的思考转化为更易于被别人理解的语言,使得我的想法可以更容易被人理解。

例如,将个人复杂的技术解释转化为易于理解的普通语言。

在这三种角色中,我尤其关注的是“翻译”,具体而言,是将“言语”转化为“语言”。这里,我们需要先解释下“言语”和“语言”这两个语言学上的概念。言语是个人的,就是你我在日常生活中说出来的话,每个人的言语都带有自己的特色和习惯。而语言则是人类总体或是特定的语言族群所共享的部分,它更加抽象和规范。言语有时候也被称为私人语言。这两个概念的关系很微妙,有所不同又紧密联系。

翻译与改写的区别

可能还要说一下“翻译”与“改写”的区别。改写主要是对原始识别内容进行处理和优化,而翻译则是对整个内容进行深度理解并转化。

实际过程

在使用GPT进行“翻译”时,我会先提交内容给GPT,而不对其进行任何处理。然后,GPT会对提交的内容进行某种理解。它会将内容理解成大多数人容易接受的表达。在这个基础上,我再进行进一步的改写。我之前以为通过指定风格等可以完全代替人类编辑,但现在觉得个性可能很难在这个过程中保留,而这一点可能比看起来更重要,这一点还需要继续考察。

根据我的使用体验,实际应用中很多时候并不需要一个单独的修正过程。也就是说,GPT这样的模型,可以在一次对话中同时完成修正和改写。如果输入内容有部分错别字,GPT模型可以在对话中自动修正这些错别字。当然如果内容比较重要,我甚至会手动修正识别后的错别字。随着我使用的熟练和GPT能力的升级,也许以后就不需要了。

提供灵感与扩展想法

最后,我还想说一种可能出现的角色,提供灵感、扩展想法。当你正在处理的问题或内容是一个在整个知识领域内比较成熟的内容,而你对它又不太了解时,GPT可以给你提供更丰富的想法和观点。

但是,如果你正在考虑的问题是一种较新的内容,或者是一种较小众的内容,那么GPT在这个过程中可能就无法提供很好的灵感和想法。在这种情况下,GPT 的这种角色可能就没那么明显了。

与此相关还有种情况,你自己都没有清晰的思路,这时候指望GPT提供太多帮助估计很难。框架是GPT 最弱的部分,我试过一直开着语音识别应用(通义听悟),尽量我把能想到的说出来,GPT确实能总结出来一些内容,就像他很少拒绝一样,但也很难从这支离破碎的内容中突然找出什么洞见,这个过程中我体会到最有价值的还是,语音识别自动帮我记了笔记。

使用到的应用:

- 录音:Obs+苹果耳机 等

- 语音识别:

- 【通义听悟】[https://tingwu.aliyun.com/u/TpC03c33033c03c](https://tingwu.aliyun.com/u/TpC03c33033c03c](https://tingwu.aliyun.com/u/TpC03c33033c03c)

- Whisper large:单人的质量稍好,Transcribe and Translate with OpenAI Whisper Colaboratory

https://colab.research.google.com/drive/1WLYoBvA3YNKQ0X2lC9udUOmjK7rZgAwr

- AI 协同:GPT4 https://chat.openai.com/?model=gpt-4

- 文章发布:https://github.com/getgridea/gridea

https://chat.openai.com/share/06df0103-fdb4-4bee-85cf-a62c8caf9ea8

语音笔记 AI 改写文章实操_哔哩哔哩_bilibili

https://www.bilibili.com/video/BV1H14y1d73e/