人工智能语义识别 + 小说续写技术,是否可以代替传统写作

发布于:2022-11-06 ⋅ 阅读:(520) ⋅ 点赞:(0)

纯粹的AI技术并不能带来小说编写效率的提升,这AI人工智能更像是一本词典。怎么说内,就比如之前的作家们写小说,一些好的词汇和剧情,可能是通过日常积累,也可能是通过搜索引擎查询来获取,而现在有了这个AI人工智能,获取起来就更加方便一些。

但是呢,包括小说大纲,剧情的把控,关键词的选取,整体的架构,语句的修饰与整理,还有等等各式各样的问题,都得需要小说作家来人为处理的,而等这些都处理完,写作的速度反而要比写传统小说还要慢。

看到这里,大家是不是感觉有点懵,这里先上一个链接,这是我结合人工智能语义识别 + 小说续写技术,写出的一本小说,名字叫《大唐仙侠剑》,已经在爱文者原创网上发布成功,并且得到了编辑大大的签约,链接地址如下:

http://www.aiwenzhe.com/NovelDetail?novel_id=11105

当然在其他网站上也可以发布,像是起点、17k、飞卢等,可为什么发在爱文者这个网上呢,原因就是:版权归作者所有

是的你没有看错,如果你在其他那些网站上发小说,你这个作家就是一打工的,就和我们这些程序员给公司写代码一样,你有自己小说的财产权吗?想多了吧,你写出来的小说都是人家网站的,可以说,只有那些极少数的个别大神,才能和网站签署版权的平等条约,其他的所有人都是给网站打工的而已。

好了言归正传,大家看完以后是不是觉得,这写出来的小说质量还行吧,是不是也不比那些大神写出来的小说文差多少呢。

这里我想说的就是,使用了人工智能技术确实是可以将作者的小说编写能力提高很多。

你想啊,我是干嘛的啊,我是一位码农啊,天天写代码的,现在跑来写小说,抢那些小说作家的饭碗。我也不是文科生,我一理工生,也没有专业的学过什么文笔修饰,只是用了一点点人工智能的技术,写出来的文章就可以直接追上那些文科生了,那你说这人工智能技术到底有没有用吧。

下面这是一个小说续写个例子:

输入:

离家十年,我又回到了扬州。

得到的结果有三种:

1、今日正是中秋佳节,家里人都忙着过节。我也该好好享受生活了。这么想着,我走出房门,准备找个酒楼吃点东西,然后在大街逛一逛。
2、"叶哥哥!"一声娇呼在身后响起,让我猛然一颤。我不敢转头看她,因为我怕我一转头就再也见不到她。

3、在路边一处破庙内,我找到了自己的师傅。这座破庙里,有两位老人家。他们是我唯一的亲人,一对老夫妻。其中一名老者,叫做李老伯,我们家族的老祖宗。而另一位老伯,则姓刘。

这段小说续写来源于一个叫彩虹小梦的网站,大家也可以来这里尝试一下,当然我写的那本小说用到了不止这一种技术,网站链接直接放在下面了:

https://if.caiyunai.com/

至于这小说续写的原理就比较复杂了,为了提高编写效率,还需要用到GPU加速,当然所有人工智能都需要用到加速,我这里简单说一下它的原理:

电脑的原理,是题海战术+笨鸟先飞。它把字变成很多数,然后,找这些数的数学(统计学)规律。

电脑的学习目标:输入一堆字,预测下一个字。

  • 只要学会这个,就可以一个个字写下去。
  • 训练的小说有几万本,每次随机挑一段 512 个字输进去,让电脑猜下一个字,看是否能猜对。
  • 不断重复这个过程,不断考试。
  • 你可以自己玩这个游戏(遮住后文,猜下一个字),会发现,需要理解前文才能玩对。

我的小模型,支持 8849 种字。每个字对应两组数,每组有 768 个数。

  • 例如:"我" = 【0.123 -1.534 ...】,【-0.827 2.343 ...】,不妨称为【输入组】和【输出组】。
  • 大模型,每个字会对应几千几万个数。

第一,编码。

  • 每个字根据它的【输入组】,变成 768 个数,每个数代表某种隐藏含义。
  • 举例,每个字的第A个数代表"好-坏"维度,第B个数代表"名词-非名词"维度,等等。

实际找到的编码,不一定有容易描述的维度含义。

  • 因为具体的编码,是电脑自动去发现,无需人工干预。
  • 最初是随机编码。电脑会不断用【求导数】的方法计算,修改编码,改进预测结果。
  • 大致可以认为:如果电脑发现,把某个字的第某个数增加 0.001,可以改进预测结果,它就去做这个事。
  • 因为预测结果是否正确,是客观标准。所以它只要不断这里+0.001,那里-0.001,就慢慢接近目标。

总之,输入 512 个字,会变成 512*768 = 393216 个数。

第二,模型会把这 393216 个数经过一番运算(和另外几千万个数做运算,这几千万个数也会不断调整),最终得到 768 个数。这个过程是最有趣的,稍后也可以解释。

第三,将 768 个数,与 8849 种字的【输出组】比较,计算和每个字的接近程度,就是输出这个字的概率。

代码是用python写的,感兴趣的同学可以down下来看看,部署很简单,下面是地址:

https://github.com/BlinkDL/AI-Writer

作者用了一万本小说进行训练,有GPU加速的话,每秒可以写50个字左右,当然如果你没有,就自求多福吧。

其他像是语义识别,情感识别,我这里就不多做介绍了,好了继续去码小说去了,代码写多了,发现换着写写小说也是挺有意思的。

本文含有隐藏内容,请 开通VIP 后查看

网站公告

今日签到

点亮在社区的每一天
去签到