如果您的网站符合以下《百度新闻源收录标准》,请您将网站信息发送邮件到 news@baidu.com ,我们的工作人员将会在7个工作日内对网站进行审核,审核通过后会邮件通知您。
注意:
1、非新闻资讯类网站提交的信息我们将不予以回复。
2、未通过审核的网站提交的 XML 文件将不予以处理。
下图为遵照《互联网新闻开放协议》制作的XML格式的网页,网页上按照标准格式列出了网站发布的新闻的相关信息。
XML网页示例:
XML标签说明: 其中带 * 标记的为必选项,未带星号标记为可选项。
*<document>——标记整个XML文件内容的开始和结束。
*<webSite>——站点地址。
*<webMaster>——负责人员的Email,请务必填写正确。您提交的XML文件不能正常收录时,我们将通过这个地址与您联系。
注意:请只提交符合百度新闻搜索收录标准的URL:
1、 百度新闻搜索收录的内容包括:时政、娱乐、体育、财经、科教文化、社会生活等各类新闻报道及媒体评论,数码产品、房产、汽车等行情资讯及评测,各行业的动态及行情,组织机构的工作动态等,是由专业人士撰写或编辑的中文信息。
2、 百度新闻搜索收录的内容不包括:个人信息、论坛、博客、广告、幽默笑话、情感故事、情色、写真、剧照、明星档案、食谱、下载、多媒体等其它类型、其它语言互联网信息。
3、百度新闻搜索希望收录高质量的中文新闻,不收录英文等其它非中文新闻。
<title>——新闻标题。
<text>——完整的新闻正文(仅包含正文文字,不包含HTML语言等其它字符)。此项的目的是使该篇新闻更多、更准地出现在搜索结果中。
<image>——新闻正文内相关图片,采用绝对地址。若该篇新闻无相关图片,可以为空;若含有多张图片,请重复使用该标签。此项的目的是使该篇新闻的相关图片展现在搜索结果中。
<category>——新闻分类, 可以遵循网站自身的分类体系,最好采用一级分类。
<pubDate>——新闻发布时间,与该篇新闻HTML页面上的发布时间保持一致。请精确到分钟;若您网站的发布时间未记录小时分钟,提供年月日即可。
其他说明:
字符 | 转义后的字符 | ||
HTML字符 | 字符编码 | ||
和(and) | & | & | & |
单引号 | ' | ' | ' |
双引号 | " | " | " |
大于号 | > | > | > |
小于号 | < | < | < |
第二步:验证XML文件
下面的地址提供了帮助您验证XML文件结构的多种工具:
http://www.w3.org/XML/Schema#Tools
http://www.xml.com/pub/a/2000/12/13/schematools.html
通过验证的XML文件能够使您提供的信息更加标准,确保您发布的新闻信息不被搜索引擎遗漏。
注意:
1、 我们将对您提交的XML文件进行审核,百度新闻搜索不保证一定能收录您提交的全部内容。
2、 审核通过的XML文件,收录后发现网站发生变化,有不符合百度新闻源收录标准的内容,我们将停止收录。
3、站点名、地址为必填项,同一站点一天之内最多提交5个不同的XML文件地址。
4、提交地址后请您注意查看弹出窗口中的信息,以确认是否提交成功。
第四步:查询XML文件状态
您可以在下面的方框中输入您提交的XML文件地址,查询该文件的处理进度和反馈信息。
注意:输入的地址必须完整,即与您提交时的地址完全一致。
*站点名、地址为必填项。
站点名 地址
如:百度 http://news.baidu.com/news.xml
备注
有需要时填写,并将内容控制在200字以内。