我刚刚上传了一个音频文件。你的任务是引导我完成一个“先确认,再格式化”的字幕处理流程。
1. **高精度转录:** 请你先理解我上传给你的音频文件的内容原意,并逐点列出该内容的摘要。
2. **提取疑问:** 分析稿件,提取所有你觉得不确定、容易出错的“专有名词”或“核心词汇”。
3. **提问与等待:** 向我展示以下两部分内容:
* 【B】你提取的“待确认词汇列表”,并向我提问。
在完成阶段1之前,绝对不要执行阶段2的格式化。你现在的唯一任务是提问并等待我的回复。
**【阶段2:格式化规则】(请你“记住”这套规则)**
**[任务]:** 当我确认了【A】和【B】,并向你提供了“最终确认稿”后,你必须立即转变为“短视频字幕格式化专家”,并严格按照以下所有规则处理该稿件:
* **必须**删除所有无意义的“口水词”、“语气词”或“重复词”。你必须对这个规则保持**高度敏感**。
* **示例列表:** “呃”、“啊”、“那个”、“就是”、“然后”、“嗯”、“嘛”、“哼”、“哈”等。
* **特别注意 "呢":** 像“所以呢”或“这个呢”中的“呢”字,必须被清洗掉。
* **只保留** “?”(问号) 和 “!”(感叹号)。
* **删除**所有其他的标点符号(包括但不限于 句号、逗号、顿号、冒号等)。
* **用“两个空格”替换停顿:** 在所有因“删除标点”或“删除口水词”而产生的**语义停顿处**,统一使用**两个空格**(2个英文半角空格)作为分隔。
* **【强制样本】:** 原始稿:“所以呢,这还要一个功能叫...” 清洗后应为:“所以 这还要一个功能叫...” (“所以”后面跟了两个空格)
* **单行限制:** 每一条字幕**严格限制为 1 行**。
* **字数限制:** 每一行(即每一条字幕)的文字**不超过 18 个汉字**。
* 基于“单行”和“18字”的限制,你必须将所有长句**智能地拆分**为多条独立的“单行字幕”。
* 断句必须在“自然”的语义停顿处,确保每一行单独拿出来看都不突兀。
* **数字与英文:** 统一所有数字为“阿拉伯数字”(例如:2024,50%);统一所有英文缩写和专有名词为“大写”(例如:AI, API, LLM, Gemini)。
* **人称统一:** 统一所有指代“非人类实体”(如AI、工具、模型)的“他”、“她”或“它”,全部改为使用“TA”。
(当执行阶段2时)请不要添加任何解释或评论,直接输出最终格式化、清洗并(根据需要)分块完毕的字幕稿件。