随着人工智能技术的快速发展,尤其是大型语言模型(LLM)的日益成熟,其在文学创作领域的表现逐渐引起关注和研究。微型小说作为一种精炼的文学表达形式,因其篇幅短小但内涵丰富,成为衡量语言模型写作能力及风格多样性的理想文本材料。通过对多个主流大型语言模型在固定条件下生成的数百篇微型小说进行系统分析,研究揭示了各模型在风格表现和变异范围上的显著差异,为理解AI写作的艺术潜力打开了新的维度。 本次研究选取多款知名大型语言模型,包括GPT-5、GLM-4.5、Claude Opus 4.1、Kimi K2等,要求它们基于同一组提示生成600至800字的微型小说。该设计确保各模型在内容基础上保持公平对比,同时设置必需元素以保证创作的内容多样性和连续性。在风格评估环节,另一款专门用于审阅的模型针对文本在声音、句法、叙事视角、结构、语调、意象、对话及实验性等维度进行评分,实现对各篇作品风格指纹与模型内部多样性的量化。
在风格维度上,研究梳理出诸多反映模型写作特质的细分轴线。其中,声音与措辞维度评价语言表达的鲜明度、具体性和语域,反映每个模型在塑造文字个性时的取舍差异。节奏与句法则考察句子节拍、结构复杂度以及段落链接方式,展示模型在句法层面的表现力差别。叙事视角涵盖人称、叙事距离、时态及叙述可靠性,揭示不同模型选择有限视角或广角叙述的偏好。同时,结构与节奏维度衡量故事场景与总结的平衡、时间线的处理、叙事方式及背景信息的传递方式等,体现模型在故事推进方式上的变异。基调与氛围则累积情绪强度及修辞态度,意象维度探讨感官细节的密度、感官偏重及主题象征手法。
对话部分统计对话量、暗示深度及标注风格,实验性维度评估形式上的创新尝试、联想空白和元小说元素。结局参数则关注故事结尾的节奏与类型,同时内容选择涵盖题材类别、话题领域、时间地点设定、冲突框架、紧张程度、角色数量、现实与幻想倾向及对提示依赖度。 多样性分析结果表明,GPT-5(中等推理版本)以明显优势成为风格表现范围最广的模型,显示出极高的内部变异度,涵盖声音、意象、视角甚至实验性风格的广泛探索。其次为GLM-4.5和Claude Opus 4.1,这两款模型也呈现出高度多样的写作风格,虽稍逊于领先者。相对而言,GPT-OSS-120B、Cohere Command A和Llama 4 Maverick展现较为狭隘的风格空间,倾向于一致性更强、变化较少的文本布局。整体而言,大多模型的风格差异聚集于一个较为紧凑的区间,唯独GPT-5的风格范围明显超脱,体现出其创作能力的潜力。
从具体风格指标看,GPT-5在声音和意象表现上领先,拥有最深层的叙事内心世界描写与最高的实验性,体现其对创作自由度和创新手法的大胆尝试。o3-pro和Kimi K2等模型同样展现出一定程度的形式创新,虽然整体上更加保守。对话量方面,Ernie 4.5产出最多的对话比例,而Mistral 3.1和GPT-5则在对话的暗示层面表现突出,强调潜台词与语境的丰富性。章节与段落安排方面,部分模型频繁采用多变的分段技巧,例如Mistral 3.1和o3-pro,营造独特的读者节奏感,而GPT-OSS-120B则表现出较为集中、块状的排版风格。 时态和叙事时间结构方面,绝大多数模型偏好以过去时呈现故事,带来传统叙事的稳定感。GPT-5则显著增加现时和混合时态的使用,呼应其高实验性的整体表现。
时间线多为线性进行,含有少量倒叙,马赛克式非线性叙事较为罕见,显示AI生成文本仍然遵循较紧凑的故事结构。 在故事主题和内容的分布上,存在跨模型的共性聚焦:存在主义和记忆类题材占据主导地位,战争与犯罪则出镜较少。背景设定大多抽象,营造超越具体时间空间的文学氛围。尽管如此,部分模型偏重于更加现实或未来派的时空环境,如Claude Opus 4.1更趋近当代和未来设定。 冲突类型的倾向也表现出一致性:以内心冲突为主,社会冲突为辅,而环境和人际冲突较少,强调故事的内省与角色心理驱动。结局倾向积极或模糊开放,消极结局稀少,显示作品整体语气趋向乐观或含蓄,缺乏明显的阴郁结尾。
此外,角色情节多以单一视角展开,侧重有限且集中的叙事焦点,复视角和全知视角使用极为有限。大多数文本不采用不可靠叙述,具体角色语气稳定,进一步突出AI写作的规范化与保守性。在文体层面,模型普遍采用较高的叙事语域,叙述真诚认真,缺乏讽刺或疏离视角。 这项研究还关注风格结构之间的关联。结果揭示声音、意象、节奏与语调密切相关,构成"写作工艺"集群,而段落布局和结局形式则相对独立,强调文学结构的多元操作可能。更深层的叙事视角和更丰富的语调跨度往往伴随更复杂的对话暗示与文本内涵。
世界构建密度与外部叙事压力成正相关,表明更具场景感的作品往往推动外部动作而非单纯内心独白。 "糟糕写作"样本与主题分析部分为研究增添了实践维度,集中展现不同模型在续写逻辑、物理常识、时间顺序与人物行为连贯性上的短板。诸如矛盾叙述、环境不合理、基础知识错误成为重复出现的现象。这些缺陷背后反映了模型短远规划能力不足与具体物理世界规则缺失,表明提升大型语言模型的文本生成质量仍需攻坚多方面的技术难题。 研究不仅为模型风格多样性的评估奠定基础,也为后续针对性优化提供方向。通过精确量化各型号在文本声音、结构和叙事深度上的差异,研究为开发更具个性和创造力的AI写作工具指明了道路。
同时,明确实验性、视角深度和意象丰富度等因素,鼓励设计更灵活的提示策略与微调方案,以解锁模型更广阔的艺术潜能。 总体而言,映射大型语言模型在微型小说创作中风格与范围的研究成果,拓宽了人们对AI文学创作复杂性的理解。它不仅展现了当前模型在艺术表达上的进步,也提示了未来智能写作应关注内容连贯性、世界观构建与创新叙述手法的平衡。随着技术日益演进,语言模型有望成为文学生态中不可或缺的创作伙伴,推动文学创新走向新的高度和广度。 。