你正赶时间,于是你对着 iPhone 快速口述了一条信息,并点击发送。不久之后,你阅读了 iPhone 转写的内容,才发现收件人的名字拼写错误,标点符号也扭曲了信息的含义。
真尴尬。你最终发送了一段完全无意义的话,还得发送后续短信为用 iPhone 的语音转写功能所导致的不完美文本道歉。别担心!大家都经历过这种情况。
根据开发者 Wispr 的说法,Flow 是首个可在 iOS 系统中任何应用内运行的听写应用和语音界面,无论是在 Slack、Messages、Mail 或 Word 中。该软件旨在将混乱且真实的语音转变为修饰精美、格式正确的书面文本。
无论你是在遛狗时记便笺、清理收件箱、起草复杂文档,还是在咖啡店中回复 Slack 消息,Wispr 表示 Flow 都能将你的语音转化,并利用 AI 整理和格式化信息。
得益于 AI,Flow 能够去除诸如 “umm” 和 “err” 等填充词,同时自动纠正常见的口语习惯错误和表达不当,修正任何尴尬的措辞或拼写错误。Flow 表示,这使得听写更快、更流畅,并能生成专业级的书面文本。
从厨房到通勤再到沙发
Wispr 表示,Flow for iOS 专为现实生活设计,无论是双手忙碌、同时处理多任务或是笔记本电脑不在手边的情况。Flow 的不同之处在于,它利用 AI 生成修饰精美的输出内容,使听写后的文本无需大量编辑即可直接发送。
Flow for iOS 可在每个应用内使用,无论是 Mail、Messages、Slack 或 Notion。该应用无需特殊命令,便能识别人类语音,然后处理标点和格式。
凭借学习你的说话方式,Flow 能记住自定义名称、缩写和短语,并将它们添加到个人词典中。用户可以安静地在手机上进行听写,其他工作由 Flow 自动完成。
Flow 还设有捕捉笔记的快捷方式,并能与桌面版软件同步。支持超过 100 种语言的 Flow for iOS,其听写速度据称比打字快四倍。
自去年在 macOS 和 Windows 平台推出桌面版 Flow 以来,Wispr 表示其听写软件已被成千上万的专业人士、创意工作者、学生和程序员使用。Flow 免费使用——每周有字数上限,用户可随时升级以获得无限听写和更多高级功能。无论是作为独立应用运行,还是与 Flow Desktop 联动,用户的账号、词典和笔记都能在 Mac、Windows PC 和 iOS 设备间保持同步。
定价与可用性: Flow for iOS 现已由 Wispr 推出,免费使用字数上限为每周 2,000 字。每月 12 美元可升级到 Flow Pro,享受无限听写字数的高级功能,并可在新功能正式推向免费版前抢先体验。
好文章,需要你的鼓励
在迪拜Gitex 2025大会上,阿联酋成为全球AI领导者的雄心备受关注。微软正帮助该地区组织从AI实验阶段转向实际应用,通过三重方法提供AI助手、协同AI代理和AI战略顾问。微软已在阿联酋大举投资数据中心,去年培训了10万名政府员工,计划到2027年培训100万学习者。阿联酋任命了全球首位AI部长,各部门都配备了首席AI官。微软与政府机构和企业合作,在公民服务和金融流程等领域实现AI的实际应用,构建全面的AI生态系统。
浙江大学等高校研究团队开发的VolSplat系统,通过"体素对齐"替代传统"像素对齐"方法,实现了快速高质量的3D场景重建。该技术仅需6张普通照片即可生成精确3D模型,在RealEstate10K等标准数据集上显著超越现有方法,为机器人导航、增强现实、建筑设计等领域提供了新的技术选择,代表了3D重建领域从二维思维向三维思维的重要转变。
苹果与俄亥俄州立大学研究人员发布名为FS-DFM的新模型,采用少步离散流匹配技术,仅需8轮快速优化即可生成完整长文本,效果媲美需要上千步骤的扩散模型。该模型通过三步训练法:处理不同优化预算、使用教师模型指导、调整迭代机制来实现突破。测试显示,参数量仅1.7亿至17亿的FS-DFM变体在困惑度和熵值指标上均优于70-80亿参数的大型扩散模型。
武汉大学团队与字节跳动公司合作,提出MAPO混合优势策略优化方法,解决AI训练中的"一刀切"问题。该方法能根据问题难度动态调整评分策略,避免传统方法中的优势反转和优势镜像问题。通过轨迹确定性判断和权重动态调整,在几何推理和情感识别任务上都取得显著提升,为AI自适应学习提供新思路。