Welcome to Hexo! This is your very first post. Check documentation for more info. If you get any problems when using Hexo, you can find the answer in troubleshooting or you can ask me on GitHub.
Quick StartCreate a new post1$ hexo new "My New Post"
More info: Writing
Run server1$ hexo server
More info: Server
Generate static files1$ hexo generate
More info: Generating
Deploy to remote sites1$ hexo deploy
More info: Deployment
🎬 NotebookLM 视频生成体验:再用 Clipchamp 加字幕最近我测试了一下 NotebookLM 的视频生成能力,顺便又用 Clipchamp 给视频加了一遍字幕。
本来只是想看看:
把一份资料丢给 AI,它到底能不能直接变成一个“能看的视频”?🤔
实际体验下来,我的感觉比较明确:
✅ 流程确实方便✅ 很适合快速把资料变成视频草稿⚠️ 但生成内容还比较单一⚠️ 中文显示和字幕后期仍然需要人工处理
这篇就简单记录一下我的测试过程,也算给后面想把博客文章、资料笔记、AI 研究内容做成视频的朋友一个参考。📝
🧠 一句话总结如果你只是想快速把资料变成一个讲解视频,NotebookLM 确实能帮你省掉很多前期工作。
但如果你想要一个真正有节奏、有趣味、有剪辑感的视频,它目前还不能完全替代人工后期。
我更愿意把它看成:
AI 视频草稿生成器 + 后期字幕辅助工具流
也就是说,NotebookLM 负责把资料“讲出来”,Clipchamp 负责把字幕“补上去”,最后还需要人来做一点整理和优化。🛠️
📌 我的测试流程这次我的大致流程是这样的:
12345678 ...
🐡 日本 Fugu 模型:不是“一个更大的大模型”,而是“会指挥模型的大模型”最近,日本 AI 公司 Sakana AI 推出了一个很有意思的模型系统:Fugu。
它的名字来自日语里的“河豚”🐡,但它在 AI 圈真正特别的地方,不是名字可爱,而是它的技术路线很不一样。
👉 Fugu 官网: https://sakana.ai/fugu/
从官网首页可以看出,Fugu 的宣传重点并不是“我自己就是唯一答案”,而是 One Model to Command Them All。
这句话其实很关键。它强调的不是单个模型参数有多大,也不是简单堆 benchmark,而是把多个模型和智能体组织起来,让它们像一个团队一样处理复杂任务。
下面这段动图更直观:它展示的是 Fugu 这种“调度、组合、协作”的感觉。用户看到的是一个统一入口,背后却可能是多个能力模块在一起工作。👇
🌟 Fugu 到底是什么?简单说,Fugu 不是传统意义上单独回答问题的一个大模型。
它更像是一个“AI 指挥官”🎼:
🧠 用户看起来是在调用一个模型
🔀 背后它会判断该找哪个模型处理任务
👥 必要时会调 ...
📌 **说明:**截至本文写作时,ChatGPT 5.6 尚未正式发布。目前网上流传的发布日期、参数、功能和跑分大多属于爆料或猜测,均应以 OpenAI 官方信息为准。本文不把这些传闻当成事实,只借这轮讨论聊聊 AI 到底把我们的学习方式改成了什么样。
🚀 ChatGPT 5.6 还没来,讨论已经来了目前 ChatGPT 5.6 还没有正式到来,但网上的爆料已经很多了。有人猜发布日期,有人传参数和跑分,也有人根据零散信息推测它会带来哪些能力。
这些说法尚未得到官方确认,真假也很难判断。可新模型还没发布,朋友圈已经替我总结好了它将怎样改变世界:
💻 “以后不用学编程了,AI 会写。”🌍 “不用学英语了,AI 会翻译。”🎨 “不用学设计了,AI 一句话出图。”✍️ “不用学写作了,AI 写得比你快。”
看完我如释重负。
按照这个趋势,再过几年应该也不用学做人了——AI 情商可能比我还高。🙂
🗣️ AI 时代最流行的学习方法:劝别人别学现在只要有人准备学习一项新技能,总能遇到一位“未来学家”。
你说想学编程,他说:
💻 “现在才学?晚了,AI 马上取代程序员。” ...
🚀 GLM-5.2 模型测评:国产开源猛将,能不能硬刚 GPT、Claude、Gemini?最近大模型圈又开始热闹了。
智谱 / Z.ai 发布并开源了 GLM-5.2,主打方向非常明确:
不是只陪你聊天,而是要干长任务、写代码、修项目、跑 Agent。🧠⚙️
简单说,它不是那种“我会写诗、我会安慰你、我会一本正经胡说八道”的通用聊天模型,而是更偏向 长程工程任务 和 Agentic Engineering 的模型。
这篇就用普通用户 + 折腾党 + 写代码视角,聊聊 GLM-5.2 到底强在哪、短板在哪,以及和 GPT-5.5、Claude Opus 4.8、Gemini 3.1 Pro、DeepSeek、Kimi 这类主流模型相比,应该怎么选。
🧾 先说结论如果你懒得看完整篇,我先把结论塞你嘴里:
结论
我的看法
🧠 综合智能
GLM-5.2 已经进入第一梯队边缘,尤其在代码和长任务上很能打
💻 编程能力
这是它最值得关注的地方,长程项目、复杂 debug、工程任务表现明显增强
📚 上下文能力
1M 上下文是核心卖点,适合塞项目、文档 ...
我必须严肃声明一件事:我的电脑不是配置低,它是配置考古现场。🫠
别人开机:按下电源,喝口水,桌面出来了。我开机:按下电源,泡杯茶,刷会儿视频,顺便思考一下人生意义,电脑还在那儿转圈圈。🌀🌀🌀
那一刻我甚至怀疑,它不是在启动系统,它是在翻族谱,看看自己祖上有没有顺利跑过 Windows。😭
📋 受害者档案:以下为本案电脑真实参数
在开始控诉之前,请先允许我出示证据。🔍
项目
详情
电脑名
DREAM(名字很大,配置很小)
品牌 / 型号
Lenovo 82TF
系统
Windows 11 Pro 64 位,版本 10.0.26220
BIOS
Lenovo JYCN58WW(2025-03-03,很新,但没用)
CPU:Intel Core i7-12700H
14 核 / 20 线程,标称最高 2300 MHz
听起来很强,跑起来很感动 🥺
内存:共 16 GB DDR5 4800
Samsung 8 GB + Micron 8 GB,双通道
理论上是豪配,实际上打开几个软件它就开始哭泣 😭
显卡:NVID ...
最近刷到一个很适合做笔记的视频:《APP 从 0 → 上线发布!免费 Vibe Coding 流程:Stitch + AI Studio + Antigravity!》。
它讲的不是“AI 生成一个页面 Demo”这种浅尝辄止的玩法,而是一套比较完整的 Vibe Coding 产品落地流程:从一个想法开始,先做 UI,再生成前端,再补后端和数据库,最后推到 GitHub 并部署到 Vercel。🚀
这篇文章就把视频内容整理成一份博客版实战笔记,方便以后自己照着做项目。
视频地址:YouTube 原视频参考转录:LilysAI 视频笔记
一句话总结 🧠这套流程的核心是:
用 AI 把“想法 → UI → 前端 → 后端 → 数据库 → 部署”串起来,让一个 App 从概念快速变成可访问的线上应用。
视频里用的案例是一个 在线宠物领养 App:用户可以浏览宠物、查看详情、提交领养申请;管理员可以录入宠物信息、审批申请;审批通过后,用户会收到消息,宠物也会从可领养列表中移除。🐶🐱
整体流程图 🗺️123456789flowchart LR A[想法] --> ...
Google 在 2026 年 6 月 3 日发布了 Gemma 4 12B。它是 Gemma 4 系列里一款比较适合个人电脑体验的开放权重模型,定位介于轻量端侧模型和更大参数模型之间,重点是把文本、图像、音频等多模态能力放进一个 12B 级别的模型里。
如果你平时喜欢在本地跑 AI 模型,Gemma 4 12B 值得关注。它的看点不是单纯参数更大,而是在模型体积、推理能力、显存占用和多模态能力之间做了一个比较实用的平衡。
Gemma 4 12B 适合谁这类模型最适合下面几种用户:
想在本地电脑上运行 AI,不希望所有数据都交给云端
有 RTX 3060、4060 Ti、4070、4090 等消费级显卡
想测试图片理解、音频理解、长文本分析等多模态能力
想通过 llama.cpp、GGUF 量化模型降低部署门槛
想找一个日常写作、代码辅助、资料总结都能用的本地模型
如果只是偶尔聊天,云端模型更省事;但如果你希望模型长期跑在自己的电脑里,或者经常处理本地文件、截图、音频资料,Gemma 4 12B 的本地价值会更明显。
主要亮点1. 多模态能力更完整Gemma 4 12B 支持文本、 ...
博客评论系统折腾记录:Twikoo 暂缓,Giscus 先顶上最近给博客折腾评论系统,原本想一步到位上 Twikoo,让访客不用 GitHub 账号也能评论,体验更接近普通留言板。结果真上手才发现:技术链路倒是不难,真正卡我的居然是 备案和 HTTPS 😅
所以这篇就简单记录一下这次折腾过程:前半段快速说说 Twikoo 为什么先搁置,后半段重点写我最后临时启用 Giscus 的操作流程。等备案处理好以后,随时可以再切回 Twikoo。🚀
一、Twikoo 为什么先放一放?🧩Twikoo 本身是很适合博客评论的,尤其是国内访客场景:
访客可以填昵称、邮箱、网址直接评论,不强制 GitHub 登录 👍
支持评论管理后台
支持最新评论
和 Anzhiyu 主题的评论弹幕、最新评论模块更搭
私有部署也可以直接 Docker 跑起来
我这边其实已经把 Twikoo 后端跑起来了:
123456docker run -d \ --name twikoo \ --restart=always \ -p 127.0.0.1:18080:8080 \ -v /opt/twikoo ...





























