Poixe Blog Poixe Blog
  • 首页
  • 产品
  • 教程
  • 社区生态
  • 公告
  • 控制台

VibeVoice:AI 开口说话,会带来怎样的体验?

1. VibeVoice 是什么? VibeVoice 是微软研究团队推出的开源文本转语音(TTS)框架,核心目标是从文本直接生成富有表现力的、长篇幅、多说话人的对话式音...
2025-08-28 xiaoguai 社区生态
VibeVoice:AI 开口说话,会带来怎样的体验?

Claude for Chrome:AI 助手正式走进浏览器

1. Claude for Chrome 是什么? Claude for Chrome 是 Anthropic 推出的浏览器扩展(研究预览),让 Claude 能在你浏览网页时“看见你所见”、在侧边栏与页...
2025-08-27 xiaoguai 社区生态
Claude for Chrome:AI 助手正式走进浏览器

SpatialLM 1.5:让 AI 听懂三维空间的语言

1. SpatialLM 1.5 是什么? SpatialLM 1.5 可理解为一类“空间语言模型”:它尝试把 自然语言 与 三维世界 建立起对齐关系,从而理解“物体在何处...
2025-08-26 xiaoguai 社区生态
SpatialLM 1.5:让 AI 听懂三维空间的语言

Jetson Thor:NVIDIA 新一代机器人“大脑”

1. Jetson Thor 是什么? Jetson Thor 是 NVIDIA 面向新一代机器人(含人形机器人)的边缘计算平台,目标是在单一模块上承载从多传感器感知、语义理解、...
2025-08-26 xiaoguai 社区生态
Jetson Thor:NVIDIA 新一代机器人“大脑”

Qoder:阿里 Agentic 编程工具亮点与实践路径

1. Qoder 是什么? Qoder 是一类面向软件工程场景的 Agentic 编程 工具,目标是将“需求理解 → 方案拆解 → 代码生成/改写 → 测试与验证 → 提交与迭代”串联...
2025-08-25 xiaoguai 社区生态
Qoder:阿里 Agentic 编程工具亮点与实践路径

马斯克宣布 Grok 2.5 开源:xAI 模型开放详解

1. Grok 2.5 开源背景 近日,马斯克宣布 xAI 将其语言模型 Grok 2.5 开源,并提供下载与使用入口。开源意味着开发者不仅可以研究模型的参数结...
2025-08-25 xiaoguai 社区生态
马斯克宣布 Grok 2.5 开源:xAI 模型开放详解

ToonComposer:AI 助力,打通中间帧与上色流程的新一代动画工具

1. ToonComposer 是什么? ToonComposer 是一套面向卡通/动漫制作的生成式 AI 方法,将传统流程中的 中间帧绘制(inbetweening) 与 上色(colorizat...
2025-08-22 xiaoguai 社区生态
ToonComposer:AI 助力,打通中间帧与上色流程的新一代动画工具

最新开源 DeepSeek V3.1 :更快、更强、更懂你的大模型

1. 版本定位与适用场景 DeepSeek V3.1 是面向通用场景的开源大语言模型版本,相比此前版本在推理稳定性、指令遵循、长文本处理与编码/数学等方向做了增强...
2025-08-21 xiaoguai 社区生态
最新开源 DeepSeek V3.1 :更快、更强、更懂你的大模型

Qwen-Image-Edit:融合语义与外观,开启 AI 图像编辑新时代

Qwen-Image-Edit 是在 Qwen-Image 基础上进一步训练的全能图像编辑模型。它把输入图像同时送入视觉语言模型与视觉外观编码器,实现 “语义一致” 与 “外观保真...
2025-08-19 xiaoguai 社区生态
Qwen-Image-Edit:融合语义与外观,开启 AI 图像编辑新时代

显存门槛降低 35%,混元 3D 世界模型 Lite 版本启用新一代 3D 创作

混元 3D 世界模型 Lite 版本面向更广泛的创作与开发人群,聚焦于显存占用、部署成本与上手路径的优化。在保持核心生成质量与时空一致性的前提下,Lite 版降...
2025-08-19 xiaoguai 社区生态
显存门槛降低 35%,混元 3D 世界模型 Lite 版本启用新一代 3D 创作

Gemini App 正式支持“记忆”与“临时聊天”,隐私与个性化并重

谷歌在 Gemini App 中新增了 记忆(Memories) 与 临时聊天(Temporary Chats) 两项能力:前者用于长期保留与你相关的偏好与事实,提升个性化回答质量;后...
2025-08-18 xiaoguai 社区生态
Gemini App 正式支持“记忆”与“临时聊天”,隐私与个性化并重

Claude 能“挂断”聊天了?Anthropic 推出对 AI 的“安全退出”

2025年8月17日,Anthropic 宣布为其大模型产品 Claude 的 Claude Opus 4 与 Claude Opus 4.1模型 推出新功能:在极少数情况下,模型可主动结束对话。引入全...
2025-08-18 xiaoguai 社区生态
Claude 能“挂断”聊天了?Anthropic 推出对 AI 的“安全退出”

逗逗AI 1.0 打造“懂你”的游戏伴侣,用科技温暖陪伴

1. 什么是逗逗AI 1.0 逗逗AI 1.0 是一款围绕“陪伴式交互”的智能辅助工具,重点面向游戏与日常娱乐学习场景。它结合语音对话、画面理解与长期记忆,为用户...
2025-08-18 xiaoguai 社区生态
逗逗AI 1.0 打造“懂你”的游戏伴侣,用科技温暖陪伴

从零到玩:使用 Hunyuan-GameCraft 来实现游戏可视化创作

一、Hunyuan-GameCraft 介绍 Hunyuan-GameCraft(下文简称 GameCraft)致力于将大模型能力与传统游戏制作流程结合,降低素材搜集、关卡搭建与脚本编排的...
2025-08-15 xiaoguai 社区生态
从零到玩:使用 Hunyuan-GameCraft 来实现游戏可视化创作

ChatGPT 更新速递:Auto / Fast / Thinking 模式上线,4o 模型回归

 2025年8 月 13 日,OpenAI CEO 萨姆・奥尔特曼(Sam Altman)宣布对 ChatGPT 进行重大更新。此次更新为 GPT-5 引入了用户可以选择的不同模式,包括“自动”(...
2025-08-13 xiaoguai 社区生态
ChatGPT 更新速递:Auto / Fast / Thinking 模式上线,4o 模型回归

从二维到三维,Matrix-3D 开启开源三维生成新篇章

一、Matrix-3D 是什么 Matrix-3D 是一个面向开源社区的三维生成大模型,目标是从二维输入(单图、多图或文本)生成可用于下游引擎与建模流程的 3D 表示(...
2025-08-12 xiaoguai 社区生态
从二维到三维,Matrix-3D 开启开源三维生成新篇章

开源医疗 AI 新突破——Baichuan-M2 全面解析

一、Baichuan-M2 是什么 Baichuan-M2 是一个面向医学与医疗健康领域的开源增强型大语言模型(Medical-Enhanced LLM)。在通用语言模型的基础上,通过医学...
2025-08-11 xiaoguai 社区生态
开源医疗 AI 新突破——Baichuan-M2 全面解析

从语音识别到生成,MiniMax Speech 2.5 带来哪些升级?

一、MiniMax Speech 2.5 是什么 MiniMax Speech 2.5 是面向实时语音交互与内容制作的多功能语音模型家族与服务套件,覆盖语音识别(ASR)、文本转语音(T...
2025-08-11 xiaoguai 社区生态
从语音识别到生成,MiniMax Speech 2.5 带来哪些升级?

星火代码画布:让AI协作编程进入可视化时代

一、星火代码画布是什么 星火代码画布是一个以可视化画布为中心的人机协作编程空间。开发者可以在同一画布中用卡片、分区、连接线描述需求、模块与交互流...
2025-08-11 xiaoguai 社区生态
星火代码画布:让AI协作编程进入可视化时代

GPT-5 正式发布:专家级智能触手可及

一、GPT-5 是什么 GPT-5 是 OpenAI 的最新一代通用大型模型家族。与以往按场景区分多个模型不同,GPT-5 采用统一的集成式架构,并由路由系统在后台自动选...
2025-08-11 xiaoguai 社区生态
GPT-5 正式发布:专家级智能触手可及
加载更多
© 2024–2025 PoixeAI. All rights reserved.