你正赶时间,于是你对着 iPhone 快速口述了一条信息,并点击发送。不久之后,你阅读了 iPhone 转写的内容,才发现收件人的名字拼写错误,标点符号也扭曲了信息的含义。
真尴尬。你最终发送了一段完全无意义的话,还得发送后续短信为用 iPhone 的语音转写功能所导致的不完美文本道歉。别担心!大家都经历过这种情况。
根据开发者 Wispr 的说法,Flow 是首个可在 iOS 系统中任何应用内运行的听写应用和语音界面,无论是在 Slack、Messages、Mail 或 Word 中。该软件旨在将混乱且真实的语音转变为修饰精美、格式正确的书面文本。
无论你是在遛狗时记便笺、清理收件箱、起草复杂文档,还是在咖啡店中回复 Slack 消息,Wispr 表示 Flow 都能将你的语音转化,并利用 AI 整理和格式化信息。
得益于 AI,Flow 能够去除诸如 “umm” 和 “err” 等填充词,同时自动纠正常见的口语习惯错误和表达不当,修正任何尴尬的措辞或拼写错误。Flow 表示,这使得听写更快、更流畅,并能生成专业级的书面文本。
从厨房到通勤再到沙发
Wispr 表示,Flow for iOS 专为现实生活设计,无论是双手忙碌、同时处理多任务或是笔记本电脑不在手边的情况。Flow 的不同之处在于,它利用 AI 生成修饰精美的输出内容,使听写后的文本无需大量编辑即可直接发送。
Flow for iOS 可在每个应用内使用,无论是 Mail、Messages、Slack 或 Notion。该应用无需特殊命令,便能识别人类语音,然后处理标点和格式。
凭借学习你的说话方式,Flow 能记住自定义名称、缩写和短语,并将它们添加到个人词典中。用户可以安静地在手机上进行听写,其他工作由 Flow 自动完成。
Flow 还设有捕捉笔记的快捷方式,并能与桌面版软件同步。支持超过 100 种语言的 Flow for iOS,其听写速度据称比打字快四倍。
自去年在 macOS 和 Windows 平台推出桌面版 Flow 以来,Wispr 表示其听写软件已被成千上万的专业人士、创意工作者、学生和程序员使用。Flow 免费使用——每周有字数上限,用户可随时升级以获得无限听写和更多高级功能。无论是作为独立应用运行,还是与 Flow Desktop 联动,用户的账号、词典和笔记都能在 Mac、Windows PC 和 iOS 设备间保持同步。
定价与可用性: Flow for iOS 现已由 Wispr 推出,免费使用字数上限为每周 2,000 字。每月 12 美元可升级到 Flow Pro,享受无限听写字数的高级功能,并可在新功能正式推向免费版前抢先体验。
好文章,需要你的鼓励
Meta宣布为Facebook Dating推出AI聊天机器人助手,帮助用户找到更匹配的对象。该AI可根据用户需求推荐特定类型的匹配者,并协助优化个人资料。同时推出Meet Cute功能,每周提供算法选择的"惊喜匹配"。尽管18-29岁用户匹配数同比增长10%,但相比Tinder的5000万日活用户仍有差距。AI功能已成为约会应用标配,Match Group等竞争对手也在大力投资AI技术。
字节跳动团队提出RewardDance框架,首次系统性解决视觉生成中的奖励模型扩展问题。该框架通过将奖励预测转为生成式任务,并将模型规模扩展至260亿参数,同时集成任务指令、参考样例和推理能力,有效解决了"奖励作弊"问题。实验显示,在文本生成图像任务中质量提升10.7分,视频生成性能改善49%,达到行业领先水平,为AI视觉创作提供了更强大可靠的技术基础。
Neo4j认为已找到让生成式AI访问图数据库记录的方法。图数据库专注于数据点之间的关系建模和查询,在欺诈检测、推荐引擎等场景中表现出色。2024年4月,ISO批准了图查询语言GQL标准,Neo4j的Cypher查询语言完全符合该标准。现代工具提供拖拽式工作流程,GenAI可作为自然语言接口,将用户请求转换为Cypher查询。
ByteDance团队开发的Mini-o3系统通过深度多轮推理突破了传统AI视觉理解的局限。该系统能像人类侦探般进行几十轮的视觉探索,在困难的视觉搜索任务上准确率达48%,相比现有模型提升显著。核心创新包括挑战性的Visual Probe数据集、多样化推理策略训练和突破性的过轮掩码技术,实现了测试时思考轮数的自然扩展。