盘点AI机器生产伪原创文章的几种方式
信息大爆炸的时代,每天有无数的创作者在创作知识信息,如果能够让机器人根据人类的要求和方向自动创作文章,是不是可以减轻人类的负担,比如机器写小说,
机器发布评论,机器发表论文研究等,理论上人工智能发展到一定水平时会出现这种情况,这也是霍金最担心的,他担心人类被人工智能毁灭了。
今天我介绍一下目前机器创作伪原创文章有两种技术方式:
一、程序算法生成
程序算法主要分成以下几种1、分词+近义词替换
顾名思义就是先对原文章进行分词,并根据同义词库进行替换,比如“我很喜欢你“,通过分词变成“我”、“很”、“喜欢”、“你”,这个几个词,然后对同义词进行替换,比如“我”字可以说换成“吾”字,“很”换成“特别”,“喜欢”换成“爱”,最后合并变成“吾特别爱你”,这样就算一个伪原创的文章了,但是这种伪原创很容易被搜索引擎识别出来。
python中我们可以用
#!/usr/local/python3/bin/python3 # -*- coding: utf-8 -* import synonyms synonyms.display("飞机")
2、翻译生成
首先对原文利用翻译引擎翻译成英文,然后再翻译回来,就变成了伪原创文章了。
我们以php为例,通过谷歌翻译来生成伪原创文章,注意谷歌翻译api可能不太稳定。
<?php error_reporting(0); $html = new article("我真的喜欢你",""); echo $html->Content(); class article { // 文章 protected $source = ""; //关键词 protected $keyword=""; function __construct($source,$keyword) { $this->source = strip_tags($source,'<p>'); $this->keyword = explode(',' ,$keyword); } public function Content() { if (!$this->source) return false; $text=str_replace(array("\r\n","\n","\r"),'[h]',$this->source); $text= $this->keyword_lock($text); $text= $this->keyword_unlock($this->wyc($text)); return str_replace('[h]',PHP_EOL,$text); } //关键词锁定 public function keyword_lock($content='') { foreach ($this->keyword as $id=>$age) { $content=&$content; $content=str_replace($age,"[k$id]",$content); } return $content; } //关键词解锁 public function keyword_unlock($content='') { foreach ($this->keyword as $id=>$age) { $content=&$content; $content=str_ireplace("[k$id]",$age,$content); } return $content; } public function mbStrSplit ($string, $len=1) { $start = 0; $strlen = mb_strlen($string); while ($strlen) { $array[] = mb_substr($string,$start,$len,"utf8"); $string = mb_substr($string, $len, $strlen,"utf8"); $strlen = mb_strlen($string); } return $array; } public function wyc($info) { $infocount=mb_strlen($info, 'UTF-8'); //1000以内可用 if($infocount<=990){ $zh_en=$this->...
点击查看剩余70%
网友评论0