VibeVoice:AI 开口说话,会带来怎样的体验? 1. VibeVoice 是什么? VibeVoice 是微软研究团队推出的开源文本转语音(TTS)框架,核心目标是从文本直接生成富有表现力的、长篇幅、多说话人的对话式音... 2025-08-28 xiaoguai 社区生态
Claude for Chrome:AI 助手正式走进浏览器 1. Claude for Chrome 是什么? Claude for Chrome 是 Anthropic 推出的浏览器扩展(研究预览),让 Claude 能在你浏览网页时“看见你所见”、在侧边栏与页... 2025-08-27 xiaoguai 社区生态
SpatialLM 1.5:让 AI 听懂三维空间的语言 1. SpatialLM 1.5 是什么? SpatialLM 1.5 可理解为一类“空间语言模型”:它尝试把 自然语言 与 三维世界 建立起对齐关系,从而理解“物体在何处... 2025-08-26 xiaoguai 社区生态
Jetson Thor:NVIDIA 新一代机器人“大脑” 1. Jetson Thor 是什么? Jetson Thor 是 NVIDIA 面向新一代机器人(含人形机器人)的边缘计算平台,目标是在单一模块上承载从多传感器感知、语义理解、... 2025-08-26 xiaoguai 社区生态
Qoder:阿里 Agentic 编程工具亮点与实践路径 1. Qoder 是什么? Qoder 是一类面向软件工程场景的 Agentic 编程 工具,目标是将“需求理解 → 方案拆解 → 代码生成/改写 → 测试与验证 → 提交与迭代”串联... 2025-08-25 xiaoguai 社区生态
马斯克宣布 Grok 2.5 开源:xAI 模型开放详解 1. Grok 2.5 开源背景 近日,马斯克宣布 xAI 将其语言模型 Grok 2.5 开源,并提供下载与使用入口。开源意味着开发者不仅可以研究模型的参数结... 2025-08-25 xiaoguai 社区生态
阿里开源Vivid-VR:AI视频修复新标杆,解锁内容创作新可能 在生成式AI技术飞速发展的浪潮下,视频修复领域迎来了革命性突破。阿里云最新开源的 Vivid-VR,一款基于生成式AI的视频修复工具,凭借其出色的帧间一致性和... 2025-08-25 xiaomei 教程
Azure TTS Importer:一键导入,将微软TTS语音接入你的阅读软件! 厌倦了机械、生硬的文本朗读?想让你的阅读软件拥有自然流畅的AI语音?今天,我们将为您介绍一款强大且安全的开源工具——Azure TTS Importer。 这款工具旨... 2025-08-22 xiaomei 教程
ToonComposer:AI 助力,打通中间帧与上色流程的新一代动画工具 1. ToonComposer 是什么? ToonComposer 是一套面向卡通/动漫制作的生成式 AI 方法,将传统流程中的 中间帧绘制(inbetweening) 与 上色(colorizat... 2025-08-22 xiaoguai 社区生态
LangShift.dev:一站式编程语言转换学习平台,助力开发者高效掌握新技能 在快速迭代的技术世界里,掌握多门编程语言已成为开发者的核心竞争力。然而,从一门熟悉的语言迁移到另一门新语言,常常伴随着语法混淆、范式理解困难等挑战... 2025-08-21 xiaomei 教程
最新开源 DeepSeek V3.1 :更快、更强、更懂你的大模型 1. 版本定位与适用场景 DeepSeek V3.1 是面向通用场景的开源大语言模型版本,相比此前版本在推理稳定性、指令遵循、长文本处理与编码/数学等方向做了增强... 2025-08-21 xiaoguai 社区生态
超长视频生成新突破!LongVie框架问世,创作不再受时长限制 在AI技术飞速发展的当下,视频生成领域取得了令人瞩目的进步,尤其是在短视频创作方面。然而,当视频时长超过一分钟时,保持画质、风格和内容的高度一致性,... 2025-08-20 xiaomei 教程
Qwen-Image-Edit:融合语义与外观,开启 AI 图像编辑新时代 Qwen-Image-Edit 是在 Qwen-Image 基础上进一步训练的全能图像编辑模型。它把输入图像同时送入视觉语言模型与视觉外观编码器,实现 “语义一致” 与 “外观保真... 2025-08-19 xiaoguai 社区生态
Vercel v0 iOS版重磅发布:AI驱动的移动开发新篇章 备受瞩目的AI驱动开发工具 Vercel v0,近日正式推出其iOS版本,为移动开发者带来了全新的构建体验。这一消息不仅在开发者社区引发了广泛讨论,更标志着Verce... 2025-08-19 xiaomei 教程
显存门槛降低 35%,混元 3D 世界模型 Lite 版本启用新一代 3D 创作 混元 3D 世界模型 Lite 版本面向更广泛的创作与开发人群,聚焦于显存占用、部署成本与上手路径的优化。在保持核心生成质量与时空一致性的前提下,Lite 版降... 2025-08-19 xiaoguai 社区生态
Gemini App 正式支持“记忆”与“临时聊天”,隐私与个性化并重 谷歌在 Gemini App 中新增了 记忆(Memories) 与 临时聊天(Temporary Chats) 两项能力:前者用于长期保留与你相关的偏好与事实,提升个性化回答质量;后... 2025-08-18 xiaoguai 社区生态
Claude 能“挂断”聊天了?Anthropic 推出对 AI 的“安全退出” 2025年8月17日,Anthropic 宣布为其大模型产品 Claude 的 Claude Opus 4 与 Claude Opus 4.1模型 推出新功能:在极少数情况下,模型可主动结束对话。引入全... 2025-08-18 xiaoguai 社区生态
AI浏览器语言学习新利器:Read Frog,让你的日常阅读变成沉浸式外语课堂! 今天,我们来介绍一款颠覆性的开源AI浏览器扩展——Read Frog(陪读蛙)。这款工具将日常网页浏览升级为沉浸式的语言学习体验,通过强大的AI技术,帮助你即时... 2025-08-18 xiaomei 教程
逗逗AI 1.0 打造“懂你”的游戏伴侣,用科技温暖陪伴 1. 什么是逗逗AI 1.0 逗逗AI 1.0 是一款围绕“陪伴式交互”的智能辅助工具,重点面向游戏与日常娱乐学习场景。它结合语音对话、画面理解与长期记忆,为用户... 2025-08-18 xiaoguai 社区生态
AI图片免费生成器:40秒极速出图,你的创意灵感库! 可我AI一款在线AI图片生成工具旨在帮助所有创意工作者,以最快的速度将想法变为现实,承诺在40秒内为您生成专业级图像。 核心功能亮点:极速、灵... 2025-08-18 xiaomei 教程