阿里媽媽智能圖象識(shí)別技術(shù)如何查詢(xún)違規(guī)商家
2023-01-19|13:51|發(fā)布在分類(lèi) / 開(kāi)網(wǎng)店| 閱讀:78
2023-01-19|13:51|發(fā)布在分類(lèi) / 開(kāi)網(wǎng)店| 閱讀:78
阿里媽媽的智能圖像識(shí)別技術(shù)如何查詢(xún)非法商家?
細(xì)心的消費(fèi)者一定知道手陶濤的“派麗陶濤”功能。
該功能實(shí)際上利用了智能圖像識(shí)別技術(shù)。
以前一些無(wú)良商家把違法信息藏在圖片里,以為可以逃過(guò)淘寶的搜索。
現(xiàn)在,這招不管用了。
同樣,智能圖像識(shí)別技術(shù)在其中扮演著重要的角色。
那么,智能圖像識(shí)別技術(shù)具體是如何識(shí)別復(fù)雜的圖片信息的呢?
阿里媽媽資深算法專(zhuān)家余婧向記者介紹了阿里媽媽在這方面的技術(shù)突破。
據(jù)悉,依托該技術(shù),阿里媽媽每周可以打擊各類(lèi)違規(guī)行為上萬(wàn)次,相應(yīng)的圖像技術(shù)也已經(jīng)應(yīng)用到阿里巴巴集團(tuán)。
以下是靖宇的分享圖,顯示為趨勢(shì)。
打開(kāi)購(gòu)物網(wǎng)站,占據(jù)空間最大的無(wú)疑是圖片。
對(duì)于用戶(hù)來(lái)說(shuō),商品的圖片有一種文字無(wú)法表達(dá)的真實(shí)感和可信度。
可以說(shuō),圖片已經(jīng)成為商品展示的最佳方式。
在展示商品的同時(shí),圖片也成為非法內(nèi)容欺騙消費(fèi)者的主要庇護(hù)所。
原因是圖像識(shí)別太難了。
但阿里媽媽作為營(yíng)銷(xiāo)平臺(tái),對(duì)圖片內(nèi)容的審核要求極高。
首先,借助圖像識(shí)別能力,阿里媽媽可以獲得完整的圖像信息,從而提高CPR預(yù)估的準(zhǔn)確性和推廣效果。
其次,隨著打擊力度的深入,違法的宣傳文字逐漸轉(zhuǎn)移到圖片上,同時(shí)也出現(xiàn)了商家違法使用著名商標(biāo)的情況。
為此,阿里媽媽投入了大量的工作來(lái)改進(jìn)圖像識(shí)別算法。
經(jīng)過(guò)幾年的積累,已經(jīng)有兩項(xiàng)重要的技術(shù)上線(xiàn)來(lái)應(yīng)對(duì)上述問(wèn)題,分別是“圖像字符識(shí)別”和“商標(biāo)檢測(cè)系統(tǒng)”。
基于這兩種算法,智能圖像識(shí)別技術(shù)已全面覆蓋智能審核等應(yīng)用場(chǎng)景,每周可打擊各類(lèi)違規(guī)行為1萬(wàn)次以上。
相應(yīng)的圖像技術(shù)也已經(jīng)應(yīng)用到阿里巴巴集團(tuán)。
字符識(shí)別字符識(shí)別,顧名思義就是從圖片中識(shí)別字符,大家并不陌生。
掃描書(shū)籍、掃描文檔、車(chē)牌識(shí)別就是這樣的技術(shù)。
但是這些技術(shù)通常都要限制場(chǎng)景,一種技術(shù)只能用在特定的場(chǎng)景。
阿里媽媽面對(duì)的目標(biāo)圖景是完全不同的,它的特點(diǎn)是非特異性和不確定性。
比如字體非常豐富,有變形、搭配、排版等復(fù)雜情況。
有了背景,可以說(shuō)識(shí)別算法難度極大。
甚至有一個(gè)名為ICDAR的國(guó)際學(xué)術(shù)會(huì)議,專(zhuān)門(mén)討論這類(lèi)問(wèn)題。
我該怎么辦?
阿里媽媽最后提出了“場(chǎng)景圖片人物識(shí)別技術(shù)”。
場(chǎng)景識(shí)別的歷史2014年8月,OCR(圖片中的字符識(shí)別)項(xiàng)目啟動(dòng),2014年11月第一版算法上線(xiàn)。
實(shí)現(xiàn)的功能是將商品圖片中的文字描述提取出來(lái),作為宣傳資料投放到終端用戶(hù)中,改善之前宣傳標(biāo)題或文字資料不足的情況。
2015年4月,圖片和文字識(shí)別在阿里媽媽的點(diǎn)評(píng)場(chǎng)景下全面上線(xiàn)。
評(píng)審工作從人工到半自動(dòng)評(píng)審階段,評(píng)審時(shí)間為T(mén)+1天。
2015年10月,后期技術(shù)優(yōu)化審核只需要幾秒鐘。
也就是說(shuō),商家上傳促銷(xiāo)創(chuàng)意圖片后幾秒鐘,阿里媽媽就能給出識(shí)別結(jié)果,并通過(guò)運(yùn)營(yíng)部門(mén)預(yù)定義的規(guī)則,快速對(duì)圖片進(jìn)行預(yù)處理和判斷。
如果有任何可疑的違規(guī)行為,也可以立即處理。
你一定很好奇。
你是怎么做到的?
智能算法有完整的迭代方案。
傳統(tǒng)的OCR(圖片中的字符識(shí)別)技術(shù)可以分為定位、分割、識(shí)別等部分。
每一部分都會(huì)涉及到大量人為設(shè)計(jì)的特征項(xiàng)目或者人為的規(guī)則,需要花費(fèi)大量的精力去觀(guān)察人物的特征。
我們發(fā)現(xiàn)這種想法的識(shí)別率很低。
阿里媽媽采用的方法是依靠深度學(xué)習(xí)技術(shù),即模型學(xué)習(xí)大量數(shù)據(jù),從而獲得的“知識(shí)”強(qiáng)于人工識(shí)別的能力。
這就需要利用大規(guī)模數(shù)據(jù)來(lái)完成訓(xùn)練和識(shí)別。
摒棄特定工程的邏輯和人為的規(guī)則,使得阿里媽媽的算法在迭代和更新上有了顯著的提升。
今年6月,阿里媽媽影像團(tuán)隊(duì)的OCR技術(shù)刷新了ICDAR Robust。
閱讀爭(zhēng)奪數(shù)據(jù)集世界最好成績(jī),大幅超越第二名。
借助這一領(lǐng)先的OCR技術(shù),阿里媽媽的圖像團(tuán)隊(duì)能夠以95%的超高準(zhǔn)確率識(shí)別圖片中的非法文字信息,有效過(guò)濾商家的惡意推廣,維護(hù)消費(fèi)者權(quán)益。
2015年,阿里媽媽共屏蔽惡意促銷(xiāo)4600萬(wàn)次。
商標(biāo)檢測(cè)系統(tǒng)在淘寶或者天貓,有些商家會(huì)故意在標(biāo)題、詳情頁(yè)、商品屬性等地方隱藏商品的品牌信息,侵權(quán)名品品牌意圖明顯。
以前阿里的運(yùn)營(yíng)者很難發(fā)現(xiàn)這種圖片式的侵權(quán)。
為此阿里媽媽開(kāi)發(fā)了一個(gè)LGOG(商標(biāo))檢測(cè)系統(tǒng),可以減少品牌侵權(quán),同時(shí)這個(gè)系統(tǒng)可以統(tǒng)計(jì)平臺(tái)上所有的商品品牌,然后進(jìn)行統(tǒng)計(jì)分類(lèi)。
鑒定樣本是一個(gè)巨大的挑戰(zhàn)。
阿里平臺(tái)有上億個(gè)品牌,這對(duì)系統(tǒng)的工作效率提出了嚴(yán)峻的挑戰(zhàn)。
其次,商標(biāo)識(shí)別涉及的場(chǎng)景具有多樣性的特點(diǎn)。
第三,商標(biāo)本身客觀(guān)上存在一些傾斜、變線(xiàn),或者遮擋、面積小等問(wèn)題。
,算法識(shí)別易受干擾。
2014年,商標(biāo)檢測(cè)系統(tǒng)上線(xiàn),經(jīng)過(guò)多輪迭代優(yōu)化,阿里媽媽已經(jīng)基本形成了一套完整的品牌管理、線(xiàn)上線(xiàn)下結(jié)合的算法解決方案。
效果突出,比如一秒鐘內(nèi)可以識(shí)別上萬(wàn)個(gè)商標(biāo),隨時(shí)配置擴(kuò)充品牌庫(kù),準(zhǔn)確率高達(dá)95%。
不要用不正當(dāng)競(jìng)爭(zhēng),有運(yùn)氣,技術(shù)不斷迭代更新,讓交易生態(tài)更加健康完善。
:《淘寶盜圖處罰細(xì)則》如何處理盜圖投訴?
怎么上訴?
淘寶會(huì)員名字可以修改嗎?
查看如何修改淘寶會(huì)員名稱(chēng)。
這個(gè)問(wèn)題還有疑問(wèn)的話(huà),可以加幕.思.城火星老師免費(fèi)咨詢(xún),微.信號(hào)是為: msc496。
推薦閱讀:
直通車(chē)圖有什么要求?淘寶直通車(chē)怎么開(kāi)?
淘寶直通車(chē)多少點(diǎn)擊率正常?如何提升點(diǎn)擊率?(直通車(chē)的關(guān)鍵詞當(dāng)中的違禁詞有哪些?)
京東年貨節(jié)什么時(shí)候預(yù)熱?產(chǎn)品折扣大不大
更多資訊請(qǐng)關(guān)注幕 思 城。
微信掃碼回復(fù)「666」
別默默看了 登錄\ 注冊(cè) 一起參與討論!