廣告文過濾技術的探討 – 首篇

對於要查詢醫療訊息的潮男潮女來說,透過網路雖然更容易獲取資訊,但也被這個大數據的洪流淹沒了。也就是說,能查到的八九成都是醫生診所自己的廣告資訊。就算是一些分享文章跟評論,部分也"看似"是被收買來發寫手文的。究竟有沒有甚麼好的方法,來幫助用戶過濾掉這些參考價值較低的評論,還給諸位潮潮一個乾淨的環境呢?

透過 Dr. Right 技術團隊的先行研究,現有的廣告文過濾技術,包括已經申請專利的,約略是下面幾種方法:

利用關鍵字重複的次數

寫廣告的人需要不斷的重複自己品牌或是產品的名稱,或是電話地址也要一直 highlight。這確實是可以用來判斷的一個基準。

建置廣告評論型態的資料庫

這是類似判斷垃圾郵件的機制,透過不斷的收集已知的廣告評論,截取特徵後存入資料庫。再透過貝葉斯演算法 ( Naive Bayes classifier ) 來對新的廣告評論做分類判斷。

分析用戶的特徵

若是該發言用戶的個人檔案中,有跟任何資訊與該推薦產品有掛勾的話,應屬寫手文。或是該用戶的言論常被移除,也是個負面指標之一。

過去的方法,能有基本的判斷精準度。但問題是:

廣告文也是會進化低 !

透過不同的發文內容,更婉轉的置入性行銷,將更難用程式語言的方式,來將其揪出。

廣告文會進化,電腦的人工智慧也需要進化。就看誰跑得快,才能先發制人。Dr. Right 研發團隊仍繼續努力開發此項技術,期待建構一個便利的醫療用搜尋引擎。請期待我們後續的更新!

 

作者: Dr.Right Blog

為您解答看醫生時的種種問題。 看病不求人,來試試 Dr. Right !

發表迴響

在下方填入你的資料或按右方圖示以社群網站登入:

WordPress.com Logo

您的留言將使用 WordPress.com 帳號。 登出 /  變更 )

Google+ photo

您的留言將使用 Google+ 帳號。 登出 /  變更 )

Twitter picture

您的留言將使用 Twitter 帳號。 登出 /  變更 )

Facebook照片

您的留言將使用 Facebook 帳號。 登出 /  變更 )

w

連結到 %s