盘点AI机器生产伪原创文章的几种方式

信息大爆炸的时代,每天有无数的创作者在创作知识信息,如果能够让机器人根据人类的要求和方向自动创作文章,是不是可以减轻人类的负担,比如机器写小说,
机器发布评论,机器发表论文研究等,理论上人工智能发展到一定水平时会出现这种情况,这也是霍金最担心的,他担心人类被人工智能毁灭了。
今天我介绍一下目前机器创作伪原创文章有两种技术方式:
一、程序算法生成
程序算法主要分成以下几种1、分词+近义词替换
顾名思义就是先对原文章进行分词,并根据同义词库进行替换,比如“我很喜欢你“,通过分词变成“我”、“很”、“喜欢”、“你”,这个几个词,然后对同义词进行替换,比如“我”字可以说换成“吾”字,“很”换成“特别”,“喜欢”换成“爱”,最后合并变成“吾特别爱你”,这样就算一个伪原创的文章了,但是这种伪原创很容易被搜索引擎识别出来。
python中我们可以用
#!/usr/local/python3/bin/python3
# -*- coding: utf-8 -*
import synonyms
synonyms.display("飞机")
2、翻译生成
首先对原文利用翻译引擎翻译成英文,然后再翻译回来,就变成了伪原创文章了。
我们以php为例,通过谷歌翻译来生成伪原创文章,注意谷歌翻译api可能不太稳定。
<?php
error_reporting(0);
$html = new article("我真的喜欢你","");
echo $html->Content();
class article
{
// 文章
protected $source = "";
//关键词
protected $keyword="";
function __construct($source,$keyword)
{
$this->source = strip_tags($source,'<p>');
$this->keyword = explode(',' ,$keyword);
}
public function Content()
{
if (!$this->source) return false;
$text=str_replace(array("\r\n","\n","\r"),'[h]',$this->source);
$text= $this->keyword_lock($text);
$text= $this->keyword_unlock($this->wyc($text));
return str_replace('[h]',PHP_EOL,$text);
}
//关键词锁定
public function keyword_lock($content='')
{
foreach ($this->keyword as $id=>$age) {
$content=&$content;
$content=str_replace($age,"[k$id]",$content);
}
return $content;
}
//关键词解锁
public function keyword_unlock($content='')
{
foreach ($this->keyword as $id=>$age) {
$content=&$content;
$content=str_ireplace("[k$id]",$age,$content);
}
return $content;
}
public function mbStrSplit ($string, $len=1)
{
$start = 0;
$strlen = mb_strlen($string);
while ($strlen) {
$array[] = mb_substr($string,$start,$len,"utf8");
$string = mb_substr($string, $len, $strlen,"utf8");
$strlen = mb_strlen($string);
}
return $array;
}
public function wyc($info)
{
$infocount=mb_strlen($info, 'UTF-8');
//1000以内可用
if($infocount<=990){
$zh_en=$this->...点击查看剩余70%
网友评论0