大數據時代,結果呈現導致安全風險

大數據時代,結果呈現導致安全風險

許多系統或平台的業務,都需要將處理結果以某種形式展示給用戶:百度需要根據用戶的搜索關鍵詞展示可能的結果網頁,淘寶需要根據用戶的關鍵詞展示相應的商品信息,去哪兒需要根據搜索展示符合條件的機票信息,前程無憂需要根據HR的搜索展示合適的候選人簡歷等。這些本來是他們的正常的業務提供流程。但在大數據的年代,這些正常的業務流程,也容易出現數據的不安全因素。

結果呈現導致知識產權安全風險

360曾經上線的綜合搜索,其實是把其它搜索引擎的結果採集過來,然後再對各家搜索引擎結果進行綜合,展示搜索結果,我們一般在技術上稱為元搜索引擎。今日頭條剛開始本身並沒有生成任何資訊,只是把各家新聞站點的新聞都採集過來,然後進行分析和整理,以自己的形式展示出來。我們先姑且不去探討這其中的誰是誰非的法律問題。但是可以看出:在大數據年代,結果的呈現會有許許多多的安全問題,或者說知識產權的問題。

相關關係泄露商業機密

如果你認為360的綜合搜索、今日頭條的新聞推薦還沒有太多直接的大數據的特徵,那麼你一定還記得大數據的第一個商業應用吧。2003年(那時候還沒有大數據的概念),奧倫-埃齊奧尼(Oren Etzioni)準備乘坐從西雅圖到洛杉磯的飛機去參加弟弟的婚禮。他知道飛機票越早預訂越便宜,於是他在這個大喜日子來臨之前的幾個月,就在網上預訂了一張去洛杉磯的機票。在飛機上,埃齊奧尼好奇地問幾位鄰座的乘客花了多少錢購買機票。當得知所有人的機票比他買得更晚,但是票價卻比他便宜得多時,他感到非常氣憤。飛機著陸之後,埃齊奧尼下定決心要幫助人們開發一個系統,用來推測當前網頁上的機票價格是否合理。

這個小項目逐漸發展成為一家得到了風險投資基金支持的科技創業公司,名為Farecast。到2012年為止,Farecast系統用了將近十萬億條價格記錄來幫助預測美國國內航班的票價。Farecast票價預測的準確度已經高達75%,使用Farecast票價預測工具購買機票的旅客,平均每張機票可節省50美元。2008年,埃齊奧尼計劃將這項技術應用到其他領域,比如賓館預訂、二手車購買等。只要這些領域內的產品差異不大,同時存在大幅度的價格差和大量可運用的數據,就都可以應用這項技術。但是在他實現計劃之前,微軟公司找上了他並以1.1億美元的價格收購了Farecast公司。而後,這個系統被併入必應搜索引擎。

關聯分析泄露商業機密

FareCast將大數據思維方式用到了極致,尤其是相關思維。招聘網站現有的商業模式在大數據年代也有很多問題。招聘網站是一個撮合型的簡歷交易平台,候選人上傳簡歷,招聘網站對簡歷的手機號碼、郵箱等信息進行屏蔽。當HR瀏覽了候選人的簡歷,需要跟候選人聯繫的時候,招聘網站收取費用。這個商業模式在大數據年代很容易被攻破。例如職品彙等公司一直關注人力資源的大數據挖掘,當通過分散式多賬號採集了招聘網站的大量沒有聯繫方式的簡歷後,再採集大量其他Profile數據,例如微博數據、領英數據、脈脈數據、人人數據等,各類數據可以通過內容的相似度進行融合,融合後數據可以進行互相補充,在簡歷中沒有的聯繫方式等信息很容易通過其它數據源獲取。(文/龔才春)

職品彙,國內領先的職場大數據徵信服務提供商。

職品彙產品體系

職品彙背景調查操作流程

職品彙的願景是「讓天下沒有欺騙」。通過完善職場各方的數據,建立我國9.2億從業者的職場信用體系,徹底解決職場誠信問題。

weixin.qq.com/r/jjkbAzP (二維碼自動識別)


推薦閱讀:

大數據時代,如何從技術上防範金融系統風險
背景調查操作流程(一)
哪有什麼靈丹妙藥,全靠自己血淚模糊

TAG:大數據時代 | 背景調查 | 商業機密 |