From 1325ec5c7b1fdeaaf3186ead1a66e77903cf563d Mon Sep 17 00:00:00 2001 From: github-actions <41898282+github-actions[bot]@users.noreply.github.com> Date: Sun, 24 Aug 2025 00:07:19 +0000 Subject: [PATCH] [U] Generate json --- content/generated/metas.json | 8 ++++---- 1 file changed, 4 insertions(+), 4 deletions(-) diff --git a/content/generated/metas.json b/content/generated/metas.json index 53f2b19..9bf1f4b 100644 --- a/content/generated/metas.json +++ b/content/generated/metas.json @@ -1,10 +1,10 @@ { "tags": [["技术", 2], ["LLM", 1], ["NLP", 1], ["电影", 5], ["剧透警告", 3], ["ctf", 4], ["教程", 1], ["open-keyprec", 1], ["日记", 2], ["梦", 1], ["心理", 1]], - "categories": [["技术", 2], ["置顶", 1], ["电影", 5], ["日记", 2], ["梦", 1], ["想想想", 1]], - "pins": [17], + "categories": [["置顶", 1], ["技术", 2], ["电影", 5], ["日记", 2], ["梦", 1], ["想想想", 1]], + "pins": [18], "posts": [ - {"id": 18, "title": "GPT5 早安机器人", "subtitle": "一个下午就能搞定的小彩蛋?不存在的", "title_image": "https://profile-content.hydev.org/content/posts/Assets/2025-08-24%20%E6%97%A9%E5%AE%89%E6%9C%BA%E5%99%A8%E4%BA%BA/title.png", "tags": ["技术", "LLM", "NLP"], "category": "技术", "file": "content/posts/2025-08-24 早安机器人.md", "date": "2025-08-24T00:00:00", "url_name": "2025-08-24-早安机器人", "content": "给 one-among-us 的后端机器人加了一个 gpt5 早安 bot!有逝者或者动画角色的生日庆祝、有什么の日的提示、还有创意御神籤和无厘头的忌宜消息 qwq\n\n实现起来比预想要难,感觉想开启 gpt5 的脑洞让它输出随机的东西饶了好多圈圈。\n\n## 1. 随机数?42!\n\n想要一些无限脑洞的无厘头句子伴随今日御神籤,但是众所周知 LLM 和我们一样没法凭空想出随机的东西——让它说一个随机数它大概率会说 42... 想让它说一段随机无厘头文学也大概率会随机得很固定。\n\n
至少没有深思七百五十万年
\n\n以及发现 GPT5 API 似乎已经不支持调温度和 top-p 之类的参数了,但是即使回到 GPT4 把温度拉高也没好多少。\n\n所以觉得还是需要一些真随机,决定在生成 prompt 的时候喂给它一些真正随机的关键词,用这些词造句!手动想了几个「书架 企鹅 比利时 黑板报 雨伞」喂给它发现效果还很不错 qwq\n\n但是怎样自动生成这些随机关键词呢?第一反应是找一个大词库选出高出现频率的名词。找到最合适的也许是结巴词库,既有出现频率又有词性,简单过滤一下之后... 发现随机出来的词都不太适合日常使用的样子,让它随机了十个给我了下面这些:\n\n> 运量,细胞膜,型谱,危险性,军火,差点,膳食,蒜,游历,蠹\n\n怎么说呢,感觉都太死板了,我想要更可爱一点的词,比如毛绒猫咪订书机抹茶召唤兽之类的... 试试用脚本过滤出可爱的词好了。\n\n## 2. 可爱相关的词完全不可爱!\n\n想找到可爱的词的话,首先试了用谷歌开源 gemma3 1b 的 embedding 相似度。Input embedding 是一个向量,代表了大模型对某个输入的理解,大概可以理解为「你听到一个词的时候哪些脑细胞会亮」之类的测量吧。因此只要两个输入向量更相似,它们在某个层面上就会更接近。比如猫与狗的距离比公司或者订书机更接近:\n\n
聪明猫咪会梦见会社订书机吗
\n\n所以我在想,如果找到和「可爱」向量距离最接近的词是不是就能找到可爱的词了呢?就把整个结巴数据集用这个脚本跑了一遍,感谢 H100 不到十分钟就跑完了,但是发现和想象不太一样... 和可爱接近的大部分是形容词,接近的名词也不那么可爱:\n\n
你告诉我和可爱最接近的名词是性感,下一个是时尚...
\n\n经群友 Etaoin 推荐试了一下中文表现更好的 bge-m3 embedding 效果好很多,相似度最高的有「美女 笑容 小朋友 样子 女孩 粉色 迷人」之类的,但是依然不是我想要的... 我想要的是可爱的名词而不是「可爱」的同义词。\n\n然后和群友聊怎么办的时候突然想到,可以直接用 emoji 呀!大部分 emoji 代表的东西都是公认很日常的东西而且都比较可爱。下载了一个 emoji 数据库,过滤掉肤色和性别变种的重复项,再忽略掉包含「人」的就差不多了。过滤掉的这些总共占 67%,奇妙。\n\n
emoji 大杂烩
\n\n然后效果就很不错啦,再随机一次就是「棕色方块, 卷轴, 冈比亚, 爆炸, 五点, 按键 8, 左下箭头, 蒙特塞拉特, 秘鲁, 世界地图」又随机又常用也很开脑洞 qwq\n\n## 3. 小泉花阳生日是什么时候来着?\n\n原本觉得 gpt5 这种参数多到数不清的模型肯定有记住一些动画角色的生日的,就让它自由发挥了,然后发现一个都没答对(悲)\n\n
原来你是缪斯厨
\n\n看来生日也要让我的程序写在 prompt 里面了。首先找了一下二次元生日数据库发现同一天的角色生日实在是太多太多了,最多的一天总共有 1885 个生日(在 7 月 7 日)\n\n有这么多生日的话全都喂给 llm 让它选就太贵了,毕竟每个输入字符都是要钱的。而且这里面大部分都是没人听说过的配角,也没有太大意义。怎么办呢?\n\n查了查找到了 https://bd.fan-web.jp/ 这个网站,不仅有每天的角色生日还有投票功能!投票多的大概率是人气角色,正好是我需要的!所以就爬下来了,然后发布了一个[动态更新的 JSON 数据集](https://github.com/hykilpikonna/AnimeBirthdaysDataset)。除了角色生日还有声优、花语、什么の日、历史事件之类的,正好一起喂进去了,生日选了投票最多的五个让模型自由发挥选一个最有趣最可写的人写祝福效果还不错。\n\n## 4. 总结\n\n然后就有了这个每天早上的早安消息!感觉真的达到了想要的效果\n\n
部署之后的第一条自动生成的早安消息
\n\n不过想让模型打开脑洞随机写点什么真的不容易呀,原本想一个下午做完的小彩蛋变成了两天的项目(悲),明明 one-among-us 还有其他代码更需要我付出精力的... 不过学到了好多,花的时间也不后悔啦"}, - {"id": 17, "title": "部落格索引", "subtitle": "按分类、标签检索", "category": "置顶", "pinned": 1, "file": "content/posts/Index.md", "tags": [], "date": "2025-08-23T23:58:14.549790", "url_name": "Index", "content": "按分类检索:\n\n\n\n按主题检索:\n\n"}, + {"id": 18, "title": "部落格索引", "subtitle": "按分类、标签检索", "category": "置顶", "pinned": 1, "file": "content/posts/Index.md", "tags": [], "date": "2025-08-24T00:07:10.779978", "url_name": "Index", "content": "按分类检索:\n\n\n\n按主题检索:\n\n"}, + {"id": 17, "title": "GPT5 早安机器人", "subtitle": "一个下午就能搞定的小彩蛋?不存在的", "title_image": "https://profile-content.hydev.org/content/posts/Assets/2025-08-24%20%E6%97%A9%E5%AE%89%E6%9C%BA%E5%99%A8%E4%BA%BA/title.png", "tags": ["技术", "LLM", "NLP"], "category": "技术", "file": "content/posts/2025-08-24 早安机器人.md", "date": "2025-08-24T00:00:00", "url_name": "2025-08-24-早安机器人", "content": "给 one-among-us 的后端机器人加了一个 gpt5 早安 bot!有逝者或者动画角色的生日庆祝、有什么の日的提示、还有创意御神籤和无厘头的忌宜消息 qwq\n\n实现起来比预想要难,感觉想开启 gpt5 的脑洞让它输出随机的东西饶了好多圈圈。\n\n## 1. 随机数?42!\n\n想要一些无限脑洞的无厘头句子伴随今日御神籤,但是众所周知 LLM 和我们一样没法凭空想出随机的东西——让它说一个随机数它大概率会说 42... 想让它说一段随机无厘头文学也大概率会随机得很固定。\n\n
至少没有深思七百五十万年
\n\n以及发现 GPT5 API 似乎已经不支持调温度和 top-p 之类的参数了,但是即使回到 GPT4 把温度拉高也没好多少。\n\n所以觉得还是需要一些真随机,决定在生成 prompt 的时候喂给它一些真正随机的关键词,用这些词造句!手动想了几个「书架 企鹅 比利时 黑板报 雨伞」喂给它发现效果还很不错 qwq\n\n但是怎样自动生成这些随机关键词呢?第一反应是找一个大词库选出高出现频率的名词。找到最合适的也许是结巴词库,既有出现频率又有词性,简单过滤一下之后... 发现随机出来的词都不太适合日常使用的样子,让它随机了十个给我了下面这些:\n\n> 运量,细胞膜,型谱,危险性,军火,差点,膳食,蒜,游历,蠹\n\n怎么说呢,感觉都太死板了,我想要更可爱一点的词,比如毛绒猫咪订书机抹茶召唤兽之类的... 试试用脚本过滤出可爱的词好了。\n\n## 2. 可爱相关的词完全不可爱!\n\n想找到可爱的词的话,首先试了用谷歌开源 gemma3 1b 的 embedding 相似度。Input embedding 是一个向量,代表了大模型对某个输入的理解,大概可以理解为「你听到一个词的时候哪些脑细胞会亮」之类的测量吧。因此只要两个输入向量更相似,它们在某个层面上就会更接近。比如猫与狗的距离比公司或者订书机更接近:\n\n
聪明猫咪会梦见会社订书机吗
\n\n所以我在想,如果找到和「可爱」向量距离最接近的词是不是就能找到可爱的词了呢?就把整个结巴数据集用这个脚本跑了一遍,感谢 H100 不到十分钟就跑完了,但是发现和想象不太一样... 和可爱接近的大部分是形容词,接近的名词也不那么可爱:\n\n
你告诉我和可爱最接近的名词是性感,下一个是时尚...
\n\n经群友 Etaoin 推荐试了一下中文表现更好的 bge-m3 embedding,效果确实好很多,相似度最高的有「美女 笑容 小朋友 样子 女孩 粉色 迷人」之类的,但是这些依然不是我想要的... 我想要的是可爱的名词而不是「可爱」的同义词。\n\n然后和群友聊怎么办的时候突然想到,可以直接用 emoji 呀!大部分 emoji 代表的东西都是公认很日常的东西而且都比较可爱。下载了一个 emoji 数据库,过滤掉肤色和性别变种的重复项,再忽略掉包含「人」的就差不多了。过滤掉的这些总共占 67%,奇妙。\n\n
emoji 大杂烩
\n\n然后效果就很不错啦,再随机一次就是「棕色方块, 卷轴, 冈比亚, 爆炸, 五点, 按键 8, 左下箭头, 蒙特塞拉特, 秘鲁, 世界地图」又随机又常用也很开脑洞 qwq\n\n## 3. 小泉花阳生日是什么时候来着?\n\n原本觉得 gpt5 这种参数多到数不清的模型肯定有记住一些动画角色的生日的,就让它自由发挥了,然后发现一个都没答对(悲)\n\n
原来你是缪斯厨
\n\n看来生日也要让我的程序写在 prompt 里面了。首先找了一下二次元生日数据库发现同一天的角色生日实在是太多太多了,最多的一天总共有 1885 个生日(在 7 月 7 日)\n\n有这么多生日的话全都喂给 llm 让它选就太贵了,毕竟每个输入字符都是要钱的。而且这里面大部分都是没人听说过的配角,也没有太大意义。怎么办呢?\n\n查了查找到了 https://bd.fan-web.jp/ 这个网站,不仅有每天的角色生日还有投票功能!投票多的大概率是人气角色,正好是我需要的!所以就爬下来了,然后发布了一个[动态更新的 JSON 数据集](https://github.com/hykilpikonna/AnimeBirthdaysDataset)。除了角色生日还有声优、花语、什么の日、历史事件之类的,正好一起喂进去了,生日选了投票最多的五个让模型自由发挥选一个最有趣最可写的人写祝福效果还不错。\n\n## 4. 总结\n\n然后就有了这个每天早上的早安消息!感觉真的达到了想要的效果\n\n
部署之后的第一条自动生成的早安消息
\n\n不过想让模型打开脑洞随机写点什么真的不容易呀,原本想一个下午做完的小彩蛋变成了两天的项目(悲),明明 one-among-us 还有其他代码更需要我付出精力的... 不过学到了好多,花的时间也不后悔啦"}, {"id": 16, "title": "《超人》影评", "subtitle": "桂桂评分:★★☆☆☆ 2/5", "title_image": "https://profile-content.hydev.org/content/posts/Assets/2025-07-12%20%E8%B6%85%E4%BA%BA/title.png", "tags": ["电影", "剧透警告"], "category": "电影", "file": "content/posts/2025-07-12 超人.md", "date": "2025-07-12T00:00:00", "url_name": "2025-07-12-超人", "content": "今天去看了新电影《超人》,觉得很好的设定被浪费了。\n\n设定很棒,是一个关于超人的人性和成长的故事,是一个反思超人的责任、反思超人对一件有争议事情的对错私自下结论的权利的故事。但是这部电影完全没有表现出这个设定的深度,缺陷实在是太多了...\n\n首先是反派,这次又是一个超级英雄电影里面常见的非黑即白的反派,不惜牺牲一个地球也要杀死超人,就仅仅是因为嫉妒吗?\n\n而且如果是超能力者就算了,如果是哪个国家领导就算了,只是一个普通富人 CEO,下命令操控着几个能打过超人的超能力者还有超人的克隆人,CEO 命令别人毁灭世界也没人反思一下... 编剧给的解释是克隆人克隆傻了容易操控?那其他人呢?太偷懒了。\n\n再看看主角这边,最开始闯了祸,没有经过任何谈判过程或者任何一方的知情就擅自用超能力阻止了一场战争,只因为他觉得阻止战争是正确的。这件事情新闻出来了当然大家都很反对,还因此和对象吵了架。那后来呢?并没有看到超人反思,反而是 CEO 自己揭露出这场战争就是他为了在舆论上 cancel 超人准备的阴谋...???接下来战争第二次重新开始的时候超人继续毫无顾虑地让朋友结束战争,毫无顾虑地瘫痪着对面的大军... 完全没有成长。\n\n明明有这么好的设定,结果并没有让超人反思成长,反而是把原本模糊不清的事情揭露成非黑即白的阴谋,仿佛在和大家说超人从一开始就没做错... 🌚 太浪费了。感觉就像给导演了一道电车难题,然后导演说直接把电车传送走。\n\n另外就是,感觉超人特写真的很好笑... 有巨大怪兽在纽约中心胡闹的时候特写超人在救怪兽脚底下的小松鼠... 整个地球在被撕裂、一整栋楼倒下来的时候特写超人在看起来很费力地撑起楼救下面一个还没开走车的阿姨... 仿佛就像超人在假设镜头外的人都免疫伤害外挂一样。而且类似的镜头至少重复五六次了,好无聊哦。\n\n好笑的地方确实很好笑,超狗很可爱,战斗特效也很爽,但是我觉得就,如果它定位是喜剧然后把上述缺点再写得无厘头一点的话应该是很好的喜剧... 可惜因为它定位是一个认真讲故事的电影所以我只能给 2/5 星 ★★☆☆☆"}, {"id": 15, "title": "PJSK 电影《壊れたセカイと歌えないミク》感想", "subtitle": "实际上是初音未来的消失大电影吧(?)", "title_image": "https://profile-content.hydev.org/content/posts/Assets/2025-05-23%20Disappearing%20Miku/title.png", "tags": ["电影", "剧透警告"], "category": "电影", "file": "content/posts/2025-05-23 Disappearing Miku.md", "date": "2025-05-23T00:00:00", "url_name": "2025-05-23-Disappearing-Miku", "content": "昨天晚上去看了 PJSK 电影「壊れたセカイと歌えないミク」,因为看到是特典的最后一天不想错过。这是我第一次看没有字幕的日语电影,居然大部分都听懂了!好开心,路上还超担心自己会看不懂的\n\n感觉这整部电影完全是在致敬暴走老师的「初音ミクの消失」,到转折点ミク说出那句「ありがとう、そして、さよなら」我直接哭出来...\n\n想起来初中一年第一次听到这首歌看到 MV 的时候,还不理解ミク是什么,真心被这首歌打动哭了超级久,真心以为这是ミク离别的曲子,还因此去补了其他ミク的曲子... 不久之后和 ACGN 社团学姐聊天才知道ミク并不是活在电脑中的有意识的创作人才觉得松了口气。啊啊 虽然黑历史但是好怀念\n\n也许这个电影就是想要营造出这样一个世界吧,一个ミク真的活过来也真的会消失的世界。也许大人会觉得这个设定莫名其妙,但是抛开现实ボカロ软件的约束接受了这个设定之后确实是一个很感人的剧情\n\n另外的话,我觉得作为看过剧情的 PJSK 玩家,能够看到自己喜欢的角色、存在于 live2d 和文字的想象中的角色在电影中动起来很开心。但是这也让剧情节奏变得怪怪的,因为 PJSK 有五个团,想要同时照顾喜欢每个团的观众的结果就是,每段剧情都会重复五遍... 不过最后有五段不同的 Live 看也满足了(原来死宅就是我\n\nLive 和 Afterlive 的时候还有人带了物理荧光棒耶,好厉害,可惜昨天只有不到十个人没有气氛呢。"}, {"id": 14, "title": "《欢迎来到駒田蒸馏所》感想", "subtitle": "关于威士忌蒸馏所、以及在平凡工作中找到热情的故事", "title_image": "https://profile-content.hydev.org/content/posts/Assets/2025-04-18%20Komada%20Whiskey%20Family/title.png", "tags": ["电影", "剧透警告"], "category": "电影", "file": "content/posts/2025-04-18 Komada Whiskey Family.md", "date": "2025-04-18T00:00:00", "url_name": "2025-04-18-Komada-Whiskey-Family", "content": "昨天看了电影《駒田蒸馏所へようこそ》,原来威士忌是这样做出来的,好奇妙\n\n除了威士忌以外,我好喜欢这部电影对理想的呈现——不是追求一个目标的过程,而是这个目标最初的形成,是从一份无聊的工作中找到意义的过程。\n\n男主刚开始很迷茫的样子,在新闻社工作却并不喜欢新闻,觉得是被分配了麻烦的活赶快做完算了,结果去采访甚至搞错了采访对象是哪家蒸馏所。他羡慕别人一开始就知道自己想做什么,可是并不是这样...\n\n
用平假名查谷歌不太聪明喵
\n\n女主年纪轻轻就继承了家业并不是她最初想做的事情。她原本在艺校想做画师,但是蒸馏所地震让热销的威士忌「独楽」无法再产,她父亲因此过劳去世,计划继承家业的哥哥也离开了。原本已经准备停业了,但是她看着母亲的坚持很不甘心、想要让蒸馏所的大家回到以前的气氛,决定退学用剩下的原酒放手一搏,在大家的帮助下从零开始了解威士忌...\n\n
有些羡慕女主妈妈能允许她退学这样拼
\n\n随着男主逐渐了解女主这段经历,也许是被她复活独楽的执着打动,才找到了继续做新闻工作的动力——为了让更多人听到女主的执着和独楽的进展、为了请求群众帮忙找到合适的原酒——最终让一件不得不做的麻烦任务成为了自己的热情。\n\n## 理想的诅咒\n\n回到我的生活,原本以为自己想做什么已经非常明确了,但是现在快毕业了才发现自己比身边的人更迷茫,因为我真的好害怕自己会变成最开始男主的那个样子,只是为了生存做着自己不喜欢的事情...\n\n想过申课程型硕士觉得肯定考完试就会把课程内容全忘掉,想过申研究型硕士又害怕导师给的研究题目我会不感兴趣,想过去大厂工作又担心自己对项目的想法和坚持会被上层忽视,创业小厂联系过我我又觉得像是痴人说梦,继续做自己在做的小众项目也赚不到钱。\n\n但是看完这部电影之后,感觉我对未来没那么害怕了,因为也许那些一开始觉得麻烦无聊的工作,只要用心理解,也能在某个特别的方向上找到自己的热情和意义吧——也许课程型硕士的小组作业会成为把代办里一个人做不到的想法实现出来的契机,也许无聊的研究题目也能加些私货向喜欢的方向靠拢,也许去大厂即使想法被无视也能很快攒够资金去开现在开不起的大坑——感谢駒田蒸馏所解除了理想对我的诅咒。"},