自動外鏈工具 在線排版工具 搜索引擎提交入口 wordpress主題推薦 批量打開網址工具 【老域名購買】 思享SEO導航 【網站合作】

百度搜索Query-圖片 質量評估標準

1138
文章目錄
  1. 介紹
  2. 相關性分檔4檔的判斷標準

介紹

什么是相關性分檔

相關性分檔是評價一個Query與一張圖片所表達的內容是否一致或在多大程度上一致。

圖片Query相關性分檔的任務綜述

標注需要關注哪些問題?

  • 多義Query:如“蘋果”,存在若干個屬性:手機品牌、一種水果、電影的名字;在標注時,圖片與任何一個意思的“蘋果”相關,即為相關,不需要考慮需求主次;
  • 圖片質量:分檔標注時, 對于最高檔, 需要是清晰高質量大圖, 其它檔不考慮圖片質量(主要是指圖片的尺寸大小、圖片的清晰程度、圖片是否有水印,通俗的說法就是 圖片好看不好看,清不清楚),只考慮文字上是否相關;
  • 頁面內容中的圖文不符或者作弊等情況:如果網頁文本對圖片的描述和圖片真實內容不符,需要按照圖片內容本身來判斷。 例如用戶搜楊冪, 該網頁文本描述某圖片為楊冪, 但是該圖片其實不是楊冪, 則判斷該圖片內容與搜索目的無關
  • 當Query是有錯別字:就按照用戶輸入的錯別字來判斷,不去考慮用戶搜索意圖和原來正確的字,就按照用戶錯別字來評;如錯別字無法理解,可以拋棄Query;
  • 色情Query: 當做普通Query來標注, 無需特殊處理

一些專有名詞解釋

  • Query:也可稱查詢詞、關鍵詞、搜索詞,指用戶輸入到搜索框想要查找的字、詞、符號等。
  • 作弊:用戶或者網站人員出于不同目的,故意將圖片的描述寫錯,如用戶在自己的相冊中,將一批不是楊冪的圖都寫上“楊冪”這樣的字樣描述,此類行為會叫做作弊。

相關性分檔4檔的判斷標準

分檔總體說明

小結:2、3檔為相關檔; 1檔為模糊關聯檔(同屬于人物, 建筑等大類, 但與Query特指的內容無關), 0檔為完全不相關檔,需要牢記相關和不相關的界限:

2、3和0、1檔的判斷的大原則:圖片中未出現Query所表達的內容,則列入0、1檔;圖片中出現Query所表達的內容,列入2、3檔;

分檔 含義 舉例
3檔 最相關,圖片與Query完全相關,圖片=Query,沒有明顯的干擾信息 劉歡

Query:劉歡

2檔 較為相關,圖片能部分解釋Query,或者說圖片出現了Query所描述的內容,但是圖片上存在另外一些Query未提及的不相關因素的干擾

劉歡Query:劉歡

1檔 較為不相關,圖片與Query存在聯系,通過這個圖片能聯想到Query,但是圖片與Query的相互解釋的能力較弱;如果搜的是人物, 顯示的是其它人物, 則為此檔。

劉歡女兒Query:劉歡

0檔 完全不相關, 搜人物, 出水果這種情況

蘋果Query:劉歡

各分檔的標注細則說明

下面對各檔的典型情況進行分別解釋。

3檔說明

  • Query與obj完全相關,且無其他不相關元素的干擾, 高質量非小圖;主觀上判斷的一個方法是:看到這個圖片能否直接聯想到這個Query

3檔典型case舉例:

Query 圖片 說明
凱利萊酒店 ?凱利萊大酒店 圖片是該Query下典型的圖片,從圖片得到的信息與Query一致,判為3分;
如果是小圖, 則降為2分。
惡搞關羽 ?惡搞關羽 圖片完全符合Query,有惡搞,也有關羽,判為3分。
張宇 ?張宇 圖片中的美女叫張宇,符合Query,判為3分;雖然大多數人搜張宇這個Query是為了看明星張宇的圖片,但是基礎相關性不考慮用戶目的
?馬 不區別對待藝術形式,內容主體就是馬,判為3分;類似的,如果是出現馬的手工玩具,也是判為3分。
秘密花園 ?秘密花園 該圖是《秘密花園》的經典場面圖,判為3分。
影視劇,動漫等Query的海報,經典畫面截圖都可以判為3分。

2檔說明

  • 圖片描述的是Query代表內容的非典型內容;如查詢酒店,提供該酒店的內部裝修,而不是酒店門面;
  • 圖片描述的是Query代表內容的一部分,如搜“北京大學”,圖是北京大學一個體育場,一個教室,一個草坪,這類的情況;
  • 圖片中有其他信息的干擾,即圖片中有一部分內容,Query中未提及;例如搜人物出現合影

2檔典型case舉例:

Query 圖片 說明
2ne1 ?2ne1 Query找的是一個組合的名字,圖片出來的其中一個成員,部分滿足判為2分;
如果出現的是組合+其他人,也是判為2分;如果出現的是組合中的某個成員跟其他不相關的人的合影,也判為2分。
廣州證券有限責任公司 ?廣州證券有限責任公司 圖片是該公司的前臺,非該公司典型圖片,判為2分。
仿制建筑物 ?仿制建筑物 圖片中有明顯的游人干擾,判為2分。
宋祖英的豪宅 ?宋祖英的豪宅 圖片雖然沒有拍清楚,但是宋祖英的豪宅在一片房子中間,出現在圖片中,判為2分。
收費站 ?收費站 漫畫的形式的收費站在圖片中有體現,圖片還有其他信息Query未提及,如汽車;判為2分。

1檔說明

圖片的內容與Query特指內容無關, 但與該特指內容屬于一大類事物;

  • 圖片表達的信息,只與Query中存在類別上的一致性, 但并不包含Query的信息,判為1檔;
  • Query描述較泛泛,沒有精確到具體的事物,是一個范圍,則同屬于這個范圍的obj起碼都認為有略微相關;

如,媒體漫畫,如果出的是水彩畫,判為1;

如,紐維手機游戲,對于xbox, psp游戲,判為1;

  • Query描述了具體的需求,如“坦克世界登陸界面”,出飛機著陸圖,可以判為1;

1檔典型case舉例:

Query 圖片 說明
小破孩離家出走 ?小破孩離家出走 Query是指離家出走的表情,且是小破孩系列的,最為相關。這張圖不是離家出走,但是是小破孩系列的,判為1。
高字 ?高字 圖上是一個塔,和“高字”是2個不同是事物,歸入1、0檔;但是由于塔形似高字,因此存在一定聯系,判為1。
機器貓 紋身 ?機器貓 紋身機器貓 機器貓圖案的紋身最為相關,圖片不滿足 紋身,但是出現了機器貓的圖案,因此判為1。
楊冪 ?楊冪 非本人,但顯示的是人像,判為1分。
華為p1 ?華為p1 同為手機,1分, 但是如果出來一盆花, 則為0分

0檔說明

圖片中未出現與Query相關的或者可聯想的內容,則判為0檔;

0檔典型case舉例:

Query 圖片 說明
上海廚衛展門票 ?上海廚衛展門票 圖片既不是門票,也沒有體現出廚衛展相關信息,完全無關,判為0分。
團校隊徽 ?團校隊徽 圖片與 隊徽類、團校都不相關,完全無關,判為0分。
校車

 

校車 完全無關,判為0分。

 

  • 容易有疑問的幾類Query分檔說明
  • 地名類分檔規則說明

對于“中國”、“日本”這類Query,很少有某張圖片能直接聯想到對應的Query,此類Query下的打分規則如下:

  • 該地的地圖、國旗、景點(就像北京的故宮,日本的富士山)、建筑、國家領導人、等典型事物,圖片上有明顯國家語言文字的東西(如漢字書法,日文),判為3分;
  • 國家的文化產物(書、電影、電視劇、動漫等)、小的景點、日本的人物、新聞圖片等,可以判為2分;Query是圖片表達內容的一個形容詞,判為2;
  • 完全無關的,判為0分。
Query 圖片 說明
日本 ?日本 圖片是富士山,是日本的典型景點,判為3;
日本 ?日本 圖片是個“日本料理”,主要說的是食物,日本是這張圖片的一個形容詞,看到圖片不會直接聯想到日本,北歐, 中國也有生魚片,判為2;

 

  • 具體的場所、機構的Query打分規則

類似于“廣州證券有限責任公司”、“永昌六中照片”、“玉淵潭公園”這類Query

  • 對于典型的、顯著的標志性圖片,如logo、大門、建筑外觀,判為3;
  • 場所中的一部分照片,無典型特征,如校園中的一棵樹,判為2;
  • 公司出產的產品,學校的學生,這些不是直接表現Query,但是有一定聯想關系的,判為1分;
  • 無關的,判為0分。
Query 圖片 說明
湖北開放職業學院

?湖北開放職業學院學校的校徽學校的校徽

學校的全景,校徽、logo等判為3
湖北開放職業學院 湖北開放職業學院 校園一角,能看到校園的一些建筑、教室等信息,但是不典型,判為2
青光中學 ?青光中學 圖片是青光中學的一個學生,有一定聯系,判為2;

關于人物的打分

類似于“楊冪”“蒼井空”的單個人物的Query

  • 對于典型單人照,符合Query要求的,如海報、寫真、活動照片,或者Q版形象等,均可判為3分;
  • 從圖片中看不出來,但是從網頁文字部分可判斷的,判為2分;
  • 對于她跟別人的合影,則形成干擾,也判為2分;
  • 對于顯示的是人物,判為1分;
  • 無關, 出水果, 建筑,判為0分;

類似于S.H.E”“少女時代”這類組合或者多人的Query

  • 對于典型合照,符合Query要求的,如海報、寫真、活動照片,或者Q版形象等,均可判為3分;
  • 圖片的組合人員都在,但是摻雜了其他無關人員的圖片,判為2分;
  • 圖片只有部分成員的,不含無關人員,部分滿足Query,判為2分;
  • 圖片只有部分成員,不齊全,還摻雜了其他無關人員的,判為2分;
  • 非演藝或明星人物,判為0分;
Query 圖片 說明
徐靜蕾 ?徐靜蕾 圖中除了徐靜蕾,還有其他人,未在Query中體現,判為2;
阿sa ?阿sa 圖片是阿嬌,不是阿sa,判為1;
楊冪 ?楊冪 圖為劉愷威,是緋聞男友,,判為1;

關于樓盤地段的打分

類似“東海閑湖城”“四季花城”這類樓盤街區的Query

  • 整體圖,規劃效果圖,均可以判為3分;
  • 樓內或者街區內的房子室內圖,戶型圖,可以判為2分;
  • 這個樓盤地段上發生的事件圖片,判為1分;
  • 其他不能從圖片看出的,無關的,判為0分。
Query 圖片 說明
東海閑湖城 ?東海閑湖城 典型的小區效果圖,判為3
東海閑湖城 東海閑湖城東海閑湖城 室內圖,屬于這個樓盤的一部分,只能判為2;
戶型圖,也只能反映這個樓盤的部分信息,只能判為2;
但是如果不是這個樓盤的, 則為1分
東海閑湖城 從來源頁更多的信息可以看到,這是一個這個樓盤的售樓場景,圖中未體現這個樓盤的相關信息,判為1

關于實物的的打分

類似“汽車”“電腦”這類Query

  • 整體的汽車或者能看到絕大部分的外部整體圖片,可以打3分;
  • 局部圖,如車內裝飾,座位,底部等,可以打2分;
  • 零部件,相關的服務,可以打2分;
  • 如果是這些實物是別的物品的點綴,不是主體本身,如衣服上印著一輛汽車的圖案,或者品牌不同,判為1分
  • 無關的打0分
Query 圖片 說明
寶馬 ?寶馬 源網頁在介紹寶馬一款車,這張圖是一張內飾圖,不夠典型,判為2;
n880s主板 ?n880s主板 Query是指n880這個手機的主板,圖片是這款手機,從圖上未看到主板的信息,相關度較低,判為1;

關于影視動漫的的打分

類似“步步驚心”“海賊王”這類Query

  • 海報,經典畫面截圖,劇照等,能直觀反映Query表達內容的,判為3分;
  • 普通截圖,沒有明顯標識的,拍攝花絮照、宣傳活動照等,相關聯但不是最匹配的,判為2分;
  • 相關主演的非劇中照,可以判為1分,
  • 無關的打0分。
Query 圖片 說明
屋塔房王世子 ?屋塔房王世子 相關演員的照片,非劇照,與電視劇相關度低,判為1;
屋塔房王世子 ?屋塔房王世子 是劇照,但是經過ps,且劇照本身也不典型,判為2
金太郎的幸福生活 ?金太郎的幸福生活 不是劇照,是電視劇的宣傳活動照片,判為2;

關于網站類型Query的打分

  • 類似“淘寶”“新藍網”這類Query
  • Logo,主頁截圖,判為3分;
  • 網站物品,相關內容等,是組成Query內容的部分的,判為2分;
  • 其它明顯網站信息,判為1分;
  • 非網站信息,0分
Query 圖片 說明
淘寶 ?淘寶 淘寶網相關界面,判為3分
淘寶 ?淘寶 淘寶網商品,與淘寶相關,卻又不是最直接體現的,判為2分
新藍網 ?新藍網 圖片為新藍網內容圖片,判為3分

其他說明

并不是所有的圖片都有明確的4檔之分,對于一些特殊Query,可能只有相關和不相關之分,結果只存在于兩個檔里面。

標注過程中的注意點強調

圖片的信息中含有與Query中同樣的文字不一定相關

Query 圖片 說明
兩個豬頭 ?兩個豬頭兩個豬頭 不是真實的兩個豬頭,即不包含Query信息(非4分3分),但是是兩個被比喻成豬頭的人, 有關聯, 標1分

需要打開源網頁去了解圖片信息

分檔標注的時對圖片內容的了解不能依賴于圖片下方的文字描述,因為這部分信息可能提取有誤,對本人不了解信息的圖片,需要打開源網頁了解圖片信息。

當Query表達的含義有多義時,與任意一個意思相關,即為相關

分檔標注的時候會遇到一詞多義的現象,例如人名,不管是明星,還是普通人,只要符合Query的都統一打分。

Query 圖片 說明
小葡萄 ?小葡萄 不知名的叫“小葡萄”的小朋友,判為3
?小葡萄 知名的“小葡萄”小朋友,判為3;

小葡萄植物的小葡萄

植物的“小葡萄”,判為3;

不理解Query意思的情況下下,可以通過多個搜索引擎去看下Query的意思,同時,不要刻意曲解Query表達的原本意義。例如鞋子卡通圖片,正常的理解就是“鞋子的卡通畫形式的圖片”,但是通過某些簡單詞的補充可能會理解為“鞋子上的卡通圖片”,這就產生了偏差。后一種的理解是刻意去扭曲原來的意思的。

這與“小葡萄”這種情況不屬于一類,不認為存在多義;僅從“鞋子的卡通畫形式的圖片”這個方面進行評估。

關于干擾信息的說明

一般圖片中會出現其他除了Query所描述內容外的其他內容,需要看圖片中的不相關的那部分是否對相關的那部分造成了干擾;

有些Query是需要借助其他東西輔助展示的,有助于Query內容表達,例如衣服,這時候,衣服模特就不成為干擾了。

Query 圖片 說明
公交車 ?公交車 圖片中的行人信息,對圖片描述主體“”造成了干擾,判為2;
外套 ?外套 服裝搭配類Query中,obj中的模特,是幫助表達的,不算干擾,判為3.

 

來源:本文由思享SEO博客原創撰寫,歡迎分享本文,轉載請保留出處和鏈接!
seo培訓評論廣告

搶沙發

昵稱*

郵箱*

網址

七乐彩选号技巧