网站万能信息采集器

   ————让您从此不再为网站内容烦恼
    ————让您的网站一天内拥有海量信息
 
 

如何发布数据到网站数据库?

复杂的例子参考阿里巴巴供应的发布设置。


我们先来测试一个最简单的例子,简单的学会了,其它的也就好办了。

1. 打开软件,载入任务,载入并选中“最简单的新闻例子”,由于试用版不能保存数据,自然就没有数据可发布了,打开安装目录下的“最简单的新闻例子.mdb”,打开这个数据库文件,打开getdata表,可以手工录入些数据,就可以发布了。不过例子已经自带了数据了,现在就可以发布了。

2. 点“添加数据”按钮,可以看到


源数据库连接:
默认已经设置好了,如果不对,需要点创建连接按钮,重新修改下。
目标数据库:
就是你自己的数据库,本例我们发布到一个access数据库里
(从http://www.yao26.com/new.mdb下载这个测试数据库),点创建连接,选择这个文件。

连接都设置好了,然后就是添加字段了。

标题
字段发布到目标数据库的title字段

源表
默认就是getdata,一般就默认就行了。目标表就是你数据库的表,这里是news

都设置好了,点添加按钮,如果要修改,就点修改按钮。

如果有多个字段要发布,就多添加几个就行了。

好了,设置好了,点“发布数据”,很快就发布进去了,打开new.mdb里的news表就可以看到数据已经成功进去了。看到了吧,很简单吧,下面我们看一个更常用的发布数据的例子。

======================================================================

数据库连接字符串:点击“创建连接”按钮,输入相应的信息,就可以了

发布数据的原理就是把源数据库的字段和目标数据库的字段一一对应,然后连接数据库,再更新数据库。

所以要设置源字段,目标字段

类型:一般是文本就行了
字段不能重复:把该字段作为判断重复的依据,去除重复数据的依据就是该字段的值是否重复。比如标题,如果标题一样就说明是重复了。
如为空则不发布:就是源字段为空时不添加到目标数据库里
去除空白字符:会把源字段中的内容中的所有空白字符去掉,包括空格、换行、Tab等
合并空白字符:就是把相邻的空白字符合并为一个,比如86   0571   85534267,合并后就是86 0571 85534267
去掉两边的空白字符:会把源字段中的内容中的左右两边的空白字符去掉
用当前日期作为值:常用于日期字段中
固定值:就是目标字段是一个固定值。此时源字段一栏为空
值为随机数:填写10-50就表示值是10到50之间的随机数
源表名字:一般为getdata,因为软件默认会把数据保存到这个表中。如果抓了顶层页面,比如上海热线企业名录那个例子,数据会保存在getindexdata表中。
目标表名字:软件能同时发布到两个表中。比如发布供求信息,往往要先注册会员,然后发布数据,需要同时发布到两个表里了。
字符替换:就是要被替换的字符串
替换为:略

字符串分割符:比如抓到的数据是 86 0571 85534267,仅仅想把电话区号添加到数据库中,就可以以空格为分隔符,
保留第 1 个。

一个一个字段添加好之后,就可以发布了。可喜的是,这里设置好后,如果你点击“全自动采集添加”,那么采集之后就会自动发布数据的,方便吧!在安装目录中的“设置中心.txt”文件中设置一下,你就可以实现定时自动抓取并添加,完全是全自动的。这是本软件独有的功能。

==========================================================================================================

下面我们以一个实例来看如何发布?
源数据库是软件自带的“阿里巴巴供应”这个任务,软件已经自带了,载入就行了
目标数据库是另外一个access数据库,点击下载 ,下载后放到软件的安装目录里

1.首先需要载入阿里巴巴供应这个任务,载入后会出现在右边,并且选中这个任务作为当前任务。点击“更新当前任务”返回


2. 载入任务之后,软件会显示出一些已经抓到的数据
点击“添加数据按钮”,出现发布界面

源数据库连接字符串:点击创建连接 按钮,输入相应信息,选择阿里巴巴供应.mdb这个文件,测试连接,连接成功就点确定返回。
目标数据库连接字符串:操作方法同上。只不过是选择刚才下载的“目标数据库供求信息.mdb”这个文件。
这样,连接字符串就都修改好了。
然后点击“发布数据”,

发布状态里变为完毕就说明发布完了。打开安装目录里的目标数据库文件,就可以看到一次性同时添加到两个表中的数据了。

由于添加供应信息,往往需要先以那个公司的名义注册会员,然后才能发布供应信息,所以要同时发布到users 和 supply两个表中。

我们来看一下,每个字段的设置

公司名 发布到 公司名
要把公司名添加到users表里,显然公司名称是不能重复的,所以是关键字段,选中字段不能重复
关键字段当然不能为空了,选中“如为空则不发布”
去除空白字符,换行符 空格等不可见字符都会去掉的

注意目标表名字现在是users,就是模拟注册用户,先发布到用户表里

对应的类别 发布到 类别

注意目标表名字现在是supply

发布日期
没有源字段,所以源字段空着。目标字段就是发布日期,选中用当前日期作为值

内容 发布到 详细说明
选中“字段不能重复”,因为标题和详细说明联合起来都是关键字段。

图片 发布到 图片
就是图片的路径 ,默认图片放在images目录,可以做个字符替换把images替换成你自己的目录。

点击数
表示某条信息的点击数 ,我们用随机数作为值,10-50,表示10到50间任意整数

公司名 发布到 用户名
用户名,就用公司名字作为用户名吧

密码
密码,密码就用固定值123456吧

电话 发布到 电话
由于抓到的电话有很多空白字符,比如
86
592
5991603

我们选中合并空白字符,处理后就会变为86 592 5991603,中间只有一个空格了

注册日期
用户注册日期,用当前日期吧

标题 发布到 标题
选中字段不能重复

公司简介 发布到 公司介绍

公司名 发布到 发布者


其实就是个字段对应的过程而已。
这就是整个设置的原理和过程,有不懂的可以随时联系我们。