互聯網新聞開放協議

互聯網新聞開放協議是百度新聞搜索制定的搜索引擎新聞源收錄標準,網站可將發布的新聞內容製作成遵循此開放協議的XML格式的網頁(獨立於原有的新聞發布形式)供搜索引擎索引,將網站發布的新聞信息主動、及時地告知百度搜索引擎。採用了互聯網新聞開放協議,就相當於網站的新聞被搜索引擎訂閱,通過百度——全球最大中文搜索引擎這個平台,網民將有可能在更大範圍內更高頻率地訪問網站的新聞,進而給網站帶來潛在的流量。右圖為遵照互聯網新聞開放協議製作的XML格式的網頁,網頁上按照標準格式列出了網站發布的新聞的相關信息。XML網頁示例:XML標籤說明:其中帶星號標記的為必選項,未帶星號標記為可選項。*<document>——標記整個XML文件內容的開始和結束。*<webSite>——站點地址。*<webMaster>——負責人員的Email。當有必要時,我們通過這個地址與您聯繫。*<updatePeri>——更新周期,單位為分鐘。搜索引擎將遵照此周期訪問該頁面,使頁面上的新聞更及時地出現在百度新聞中。*<item>——標記每篇新聞信息的開始和結束。標記內為單篇新聞信息,不包括新聞專題。*<title>——新聞標題。*<link>——新聞url地址,與單篇新聞一一對應;若分頁的新聞存在多個url,相當於多篇新聞。<description>——新聞內容簡介。*<text>——完整的新聞正文(僅包含正文文字,不包含html標記、圖片鏈接等其它字元)。此項的目的是使該篇新聞更多、更准地出現在搜索結果中。*<image>——新聞正文內相關圖片;採用絕對地址;若該篇新聞無相關圖片,可以為空;若含有多張圖片,重複使用該標籤。此項的目的是使該篇新聞的相關圖片展現在搜索結果中。<headlineImg>——為有可能成為頭條的新聞製作的頭條圖,採用絕對地址。<keywords>——反映新聞主題內容的一個或多個關鍵詞,關鍵詞之間以空格隔開。此項僅作為參考,檢索結果不會完全依賴於此標籤中的內容。<category>——新聞分類,可以遵循網站自身的分類體系,最好採用一級分類。<author>——新聞作者,可以為機構或個人。<source>——新聞來源,即原創媒體或其它機構。*<pubDate>——新聞發布時間,請精確到分鐘;若您網站的發布時間未記錄小時分鐘,提供年月日即可。推薦的時間格式:年月日小時分鐘秒如:2005-11-0910:37牋|牋2005/11/0910:37:00牋|牋2005.11.0910:37:00牋|2005年11月09日10時37分00秒牋|牋Fri,09Nov200510:37:00GMT開放協議使用開始之前,您需要了解以下幾點:無論您的網站已經成為百度新聞源,還是尚未被百度新聞搜索收錄,您都可以使用此開放協議。您使用開放協議提供的內容應全部為符合下面《新聞源收錄標準》的新聞信息。互聯網新聞開放協議只是原始新聞源收錄方式的一種協助和有益補充,而不是完全取代。新聞源收錄標準:百度希望新聞源多樣化,鼓勵原創新聞內容,如果是具有大量有價值的新聞內容並能及時更新的正規、合法媒體網站,且網站伺服器穩定、高速,就符合了百度收錄新聞源的基本原則。百度新聞搜索收錄的內容包括時政、娛樂、體育、財經、科教文化、社會生活等各類新聞報道及媒體評論,數碼產品、房產、汽車等行情資訊及評測,各行業的動態及行情,組織機構的工作動態等;是由專業人士撰寫或編輯的中文信息;不包括發布的個人信息、論壇、博客、廣告、幽默笑話、情感故事、情色、寫真、食譜、下載、多媒體等其它類型、其它語言互聯網信息。您應對您提供的全部內容承擔一切法律責任,保證您提供內容的真實性、合法性,並不得侵犯任何第三方的權益。下面就開始吧!第一步:創建XML文件請按遵照上面公布的開放協議內容製作XML文件。其它說明:支持的編碼格式有GB2312、UTF-8、BIG5。您可以將你網站某一時間段發布的全部新聞放在一個XML文件中,也可以分頻道或欄目放在多個XML文件中。請保持每個XML文件處於按更新周期持續自動更新狀態。每個XML文件至多存放最新發布的100條新聞,無需保存之前的新聞。請將發布的新聞按照時間排序,即最新發布的新聞在最上端,否則可能有新聞被遺漏。XML標籤內容中的一些特殊字元必須轉換為XML定義的轉義字元,否則將發生錯誤導致搜索引擎不能獲取頁面上的新聞,具體參見下表。字元轉義後的字元HTML字元字元編碼和(and)&&amp;&單引號『&apos;『雙引號"&quot;"大於號>&gt;>小於號<&lt;<轉義字元中的"&"無需再轉。第二步:驗證XML文件下面的位置提供了幫助您驗證XML文件結構的多種工具:(參見資料)通過驗證的XML文件能夠使您提供的信息更加標準化,確保您發布的新聞信息不被搜索引擎遺漏。第三步:提交XML網址提交前請將XML文件上傳到您的網站伺服器,將XML文件的URL地址及其它信息輸入下面對應的方框內。搜索引擎將定向訪問該URL地址,當URL地址發生變化時需要重新提交。百度新聞搜索將對你提交的數據進行測試和觀察一周,若您按照互聯網新聞開放協議的標準進行製作但存在問題,我們會根據XML頁面上提供的郵件地址與您聯繫。注意:百度新聞搜索不保證一定能收錄您提交的全部內容。*站點名、地址為必填項。

推薦閱讀:

王棠雲有什麼背景嗎?
他把路邊的石頭賣給人當寵物養,半年賺了600萬美元!神忽悠
雙飛翼布局與聖杯布局
網站使用top後綴域名怎麼樣?
競爭壓力如此大,未來家庭結構將走向何方?

TAG:互聯網 | 新聞 | 協議 | 開放 | 聯網 |