計算機本科畢業設計-瀏覽器過濾軟件的實現_第1頁
計算機本科畢業設計-瀏覽器過濾軟件的實現_第2頁
計算機本科畢業設計-瀏覽器過濾軟件的實現_第3頁
計算機本科畢業設計-瀏覽器過濾軟件的實現_第4頁
計算機本科畢業設計-瀏覽器過濾軟件的實現_第5頁
已閱讀5頁,還剩21頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

瀏覽器過濾軟件的實現摘要近年來,惡意信息(主要是淫穢色情內容)蔓延到互聯網和移動通信網絡,對廣大未成年人的身心健康造成了不利影響。這個問題越來越受到各個學科的關注。目前,不良照片和不良網站主要有三種過濾技術:基于URL的過濾、基于文本的過濾和基于圖像的過濾。與前兩種技術相比,基于圖像內容的過濾技術更具適應性和靈活性。本主題重點介紹基于圖像內容的過濾。截至2019年9月,我們尚未獲得關于應用于CNKI移動瀏覽器的基于圖像內容的惡意圖像過濾的國內論文調查。此外,搜索引擎也沒有找到任何用于銷售或推廣的國內應用程序。基于移動瀏覽器中圖像內容的流氓圖像過濾軟件。首先,在桌面Windows的瀏覽器中實現過濾不良圖像的軟件。軟件的網絡數據截取模塊采用LSP技術,圖像檢測模塊采用人臉檢測、白平衡、皮膚檢測、支持向量機等技術。SWM等(包括膚色檢測、紋理檢測、連續皮膚區域檢測等)。該軟件已被證明非常準確,可以實時過濾從桌面Windows瀏覽器訪問的不良圖像。之后我將不適用于WindowsMobile的Openc庫移植到WindowsMobile6平臺,并將針對桌面Windows開發的瀏覽器惡意圖片過濾軟件移植到WindowsMobile6平臺。經測試,在Windows手機上運行良好,但由于智能手機的硬件狀態,智能手機上的人臉檢測一般需要大量計算,圖像檢測模塊需要時間。關鍵詞:瀏覽器過濾軟件系統設計手機PC端

目錄TOC\o"1-3"\h\u13150摘要 123237第一章緒論 1288091.1研究背景 1175991.2研究意義 126351.3國內外研究現狀 211024第二章相關技術概述 532562.1網絡監控技術 549382.2信息過濾 5221802.3基于URL的過濾技術 614935第三章軟件需求分析和總體框架設計 711564第四章基于內容的敏感圖片過濾技術 8177424.1圖片庫的建立 830004.2掩碼圖像的輔助處理 8107494.3紋理檢測模型建立 924785第五章網頁內容分級過濾系統設計 1153355.1總體設計 1117755.2分級過濾系統客戶端設計 12325415.3使用BHO監控IE瀏覽器 13103第六章圖像檢測模塊設計、實現與測試 15326326.1OpenCV概述 15307576.2圖像檢測模塊及其在Windows上的實現 15287826.2.1人臉檢測 16217186.2.2皮膚檢測 1790326.3圖像檢測模塊及其在Windows上的測試 1823203第七章瀏覽器過濾軟件的設計 20193067.1LSP技術相關模塊向WindowsMobile移植 20306577.2WindowsMobile手機瀏覽器不良圖片過濾軟件的測試與改進 2127947第八章總結 2231310參考文獻 24第一章緒論研究背景在過去的幾年里隨著互聯網的普及色情信息已遍布互聯網。這對未成年人的身心健康造成了巨大的影響,2009年公安部宣布公安機關關閉了9200多個色情網站,如何防止未成年人接觸網絡色情內容正在日趨成熟[1]。對所有研究領域的興趣增加另一方面這一解決方案與網絡監控部門和網絡運營商的努力密不可分,另一方面,對客戶在瀏覽互聯網時訪問的色情數據進行實時保護和過濾是一種有效解決該問題的方法1.目前,在客戶端過濾來自互聯網的色情內容主要有三種技術,通過UniformResourceLocatorURL過濾。按文字內容過濾,按圖片內容過濾。前兩種技術有明確的局限性和界限。基于URL的過濾技術有兩種格式:白名單和黑名單[2]。這是因為授權和中斷網站的數量是有限的。因此,白名單計劃非常死板、不靈活,難以適應互聯網用戶的需求。黑名單項目每天都在世界各地的色情網站上出現和消失。及時更新網站的黑名單是很困難的[3]。而魚難免會漏網。如果頁面不包含敏感關鍵字基于文本內容的過濾技術會失敗并且誤報率很高。這是因為很難準確理解上下文的含義。大多數色情網站和頁面都包含色情圖片。基于圖像內容的過濾技術檢測圖像是否包含色情內容。它受到學術研究人員和軟件公司的廣泛青睞。這是因為與之前的兩種技術相比,它提供了適應性和靈活性。本文檔開發的濾鏡軟件框架主要針對基于圖像內容的濾鏡。但是上面提到的三種過濾技術可以相應地擴展。然后它被廣泛用于軟件中。軟件框架的設計是開發用于過濾網絡色情的客戶端軟件的關鍵問題。通用框架使用BrowserHelper的BHO技術,ObjectBHO是一個COM組件,是微軟為第三方程序員提供的交互式瀏覽器開發接口[4]。BHO的限制是只能在瀏覽器中使用。僅限IE內核在Firefox、Opera、Chrome等非IE瀏覽器中無法實現。本白皮書提供了一個基于Winsock2LayeredServiceProviderLSP的網絡色情過濾軟件框架,適用于IE內核瀏覽器和非IE內核瀏覽器。LSP技術可以實現網絡數據包攔截,圖像識別模塊使用開源計算機視覺庫實現,OpenCVVisualC++9作為集成開發環境[5]。研究意義謀取利益避免缺點積極控制互聯網對青少年的影響。并將互聯網變成青年成長和進步的綠色階梯。中國相關服務商表示:“綠色上網”和相關政府機構是可能的。發布口號“青年互聯網在中國”綠網行動:信息產業部于2006年2月在陽光綠網計劃下開展了一系列活動,指導綠色互聯網中國的實施[6]。電信啟動了全民綠網項目,中國通信標準協會和中國互聯網協會正在研究環保的互聯網接入標準。教育應該是防止青少年被不良網站毒害的最根本途徑。只有當年輕人真正意識到這些網站的危險時,才能完全避免它們。但實際上年輕人的好奇心相當高,這些網站大多是為了牟利而使用有趣的主題[7]。讓人們,尤其是青少年,迷失方向并最終沉迷其中。并停止了他們的研究。仍然需要計算機和一些網絡技術來限制用戶上網。未成年人是社會的總理,也是國家的未來。現代傳播方式的廣泛使用,為色情內容的迅速傳播創造了有利條件,對未成年人的身心健康構成嚴重威脅。重要性很緊迫,也很實際。有效阻斷互聯網上的錯誤信息,需要網絡運營者和網絡運營者的共同努力。他們可以使用網絡控制功能從源頭阻止錯誤網站[8]。為了不讓他們提供的虛假內容泄露給互聯網用戶。許多不良網站和不良信息仍然在網絡上流傳,因此您還需要在Internet客戶端上安裝過濾軟件產品。隨著移動平臺成為未成年人理想的在線工具。在移動客戶端上啟用色情過濾與在桌面客戶端上一樣重要。本文檔中介紹的適用于這款適用于WindowsMobile手機瀏覽器的假圖片過濾軟件是在移動設備上過濾色情內容的有益嘗試。大多數色情網站和色情網站都包含色情內容,因此色情分類是過濾色情的重要技術。基于圖像內容的過濾技術是互聯網色情過濾技術中不可替代的重要組成部分。本軟件選用的圖像探傷原理是基于圖像內容的檢測技術。這是因為它比基于圖像內容的過濾技術更加通用和準確。根據智能手機平臺的軟硬件特點本軟件使用的圖像識別原理主要是皮膚識別[9]。人臉檢測特別是,SVM因其低復雜度和高皮膚檢測精度而被分類。為未來的發展提供思路和參考。國內外研究現狀目前過濾色情網站的方法主要有四種:關鍵字攔截,即下載時掃描網站。如果下載的內容包含預定義的關鍵字網站將被封鎖這種方法不是很有效。這是因為語言和語言環境的清晰度很高。并且沒有文字關鍵字是無法處理圖片的[10]。封包攔截,例如通過攔截特定IP地址的請求進行訪問控制,快速且易于使用。但是對于一些新技術沒有動力,比如獨立的虛擬IP主機。帶有URL阻塞的訪問控制,也就是URL阻塞,有兩種行動方案。該系統旨在僅訪問人們認為合適的網站。這限制了可以訪問的URL太多。被拒絕訪問的URL集由軟件保留。并且只能訪問未包含的URL這個方法是不行的,因為它跟不上色情網站的刷新率[11]。按內容過濾圖片。此方法使用圖像顏色、紋理和其他屬性。基于膚色屬性向量標記膚色區域并過濾敏感圖像。該技術克服了基本P地址過濾技術的滯后性和基本網站過濾中的文本內容限制。這導致一些相關站點的丟失并阻止了許多有用的站點。當今的網絡安全技術普遍解決了過濾和視覺檢測能力不足的問題。上述過濾方式也存在問題:分類方式難以對所有網站進行分類。實時性下降:更新敏感的URL數據庫發現很難跟蹤色情網站的增長速度。由于局限性,缺乏檢測和誤報:大多數色情網站使用不同的信息網站,如:B.base10網站中的圖片文字內容過濾技術不完整。內容包括圖像和不斷變化的關鍵字。遮擋效果不可行,識別效果不理想[12]。目前,國內外一些科學家正在研究基于內容的圖像過濾技術并提供初步成果。但是filter模型的正檢率和誤檢率等等,很多問題都沒有解決。不理想,檢測速度不滿足實時性要求。因此,必須改進技術。針對以下高靈敏度圖像識別技術:然后通過人體手勢識別進一步判斷該圖像是否為敏感圖像。并且每張圖片允許運行6分鐘,在一個有565張敏感圖片和4289張敏感圖片的圖庫中,誤報率是4%,正向識別率只有52.2%。這個系統工作。慢不適合網絡條件下的大規模實時處理。且檢測精度不足[13]。1997年,JamesZeWang使用了一種將常規高感光圖像預組裝的非感光圖像比較方法,用于與已知圖像進行高感光圖像識別,通常會創建高感光度。并提取各種特征出去創建一個圖像屬性庫。在記憶中提取已知圖像屬性并與圖像屬性庫的屬性進行比較。如果您發現在您的照片庫中最相似的圖像中發現了一定比例的敏感圖像,圖像被認為是敏感的。否則它被認為是一個微妙的形象。細膩的畫面。這種方法的問題在于創建圖像庫和選擇特征向量。由于大量敏感和不敏感圖像結果,特別有許多精致的圖像。如何有效組織一個精致不敏感的圖片庫而你可以選擇哪些功能來顯示這些細膩、不敏感的圖像是很難修復的[14]。速度不符合實時要求。首先,使用膚色模型來確定圖像中是否存在任何膚色。如果不它被認為是低靈敏度圖像,這種情況下,考慮圖像是否有人臉。考慮一張人臉比例高的照片是否細膩,以及圖片的任何部分是否不包含人臉。如果不包括零件人體的它被認為是不精致的圖像。否則,使用手勢識別。如果發現淫穢手勢這些圖像是保密的。該方法通過排除單個層來執行。它有很多技術,但沒有太多動作。識別結果未在文檔中描述。雖然可以檢測但實時檢測的速度可能難以匹敵,2001年,中國科學院計算技術研究所的段麗娟及其同事提出了一種利用顯示過濾色情內容的方法,利用計算機視覺和模式識別的結果。過濾方法:該方法提供了一個多層次的圖像處理框架,結合了膚色模型的驗證。由于支持向量機(SVM)的分類和人類視覺圖像分析工具研究的最接近的驗證結果。這種方法可以達到85%以上,識別模型的準確率有待進一步提高。因此,基于內容的高靈敏度圖像濾波技術值得進一步研究[15]。當今Internet上提供三種主要類型的惡意過濾技術。基于URL的聯合過濾、網站文字內容過濾圖像內容過濾“綠壩花季護航”軟件(可擴展為視頻)同時使用前三級調平技術。前兩種技術很容易使用,但是也有明顯的局限性。基于URL的過濾技術有兩種類型:白名單和黑名單。白名單程序相當有限,靜態的,有限的,不靈活的,難以根據互聯網用戶的需求進行定制。并且只適合小孩子。各種網站它不斷彈出和死去在正確的時間更新色情網站黑名單很困難。魚在網上游蕩是不可避免的。消息內容過濾技術將失效。申請有限制并且很難準確地了解上下文的含義。這導致高誤報率。大多數色情網站和頁面都包含色情圖片。基于圖像內容的過濾技術使用圖像處理技術來確定圖像是否包含色情內容。與前兩種技術相比,它的適應性和靈活性被研究人員和軟件公司廣泛使用。幸運的是,本主題側重于按圖像內容進行過濾[16]。

第二章相關技術概述2.1網絡監控技術網絡監控技術通過分析通過網絡傳輸的數據來做到這一點。目前有兩種方法用于在網絡中檢索信息。第一種方法是通過方法。還有一種是pass-by方式,pass-by方式是重定向用戶流量。用戶流量必須經過相關系統分析處理后才能傳輸。這可能會導致用戶訪問延遲[17]。該系統使用分布式計算。內存數據庫和其他技術提供用戶信息加工。減緩信息的流動當網絡電流超過過濾設備可以傳輸的閾值時,就會發生網絡擁塞。在正常網絡負載條件下使用通過方法的過濾器產品會產生30-100毫秒延遲時間的響應,從而增加管理和成本。第4層負載分配器通常需要在多個過濾器產品之間動態分配流量。然而,在企業的早期階段,這可能是一個失敗點。系統負載輕,前期投入小,路徑模式下,在采集點向系統發送一份用戶流量副本[18]。系統將對其進行分析和處理,以確定該信息是否被截獲。如果你不想攔截此消息將被取消,處理將結束。如果需要攔截發送消息提示用戶訪問Web服務器以終止連接并將用戶的請求重定向到另一個位置。路徑模式使用不影響網絡流量的身份驗證模式。本質上不會影響網絡性能并且不需要對網絡結構進行任何更改[19]。2.2信息過濾過濾和提取數據是兩個不同的概念。它們都需要動態過濾信息流。但數據過濾側重于排除用戶不想接收的數據和用戶的長期需求。(在一段時間內相對恒定)搜索呈現用戶。你需要的信息和你的需求一直在變化,然而,它們是密切相關的。并且很多過濾方式還使用了以前成功的搜索方式,比如匹配、按預定義的人口統計或類別輕松過濾。決定將顯示哪些內容和服務[20]。例如,員工可以根據工作性質使用個人網站訪問與工作相關的信息和應用程序。僅基于年齡和屬性值等指標規則過濾根據特定規則應用過濾。為此,管理員(在顧問的幫助下)必須設置適當的規則。監管方法提供了一種靈活的機制來制定業務應用程序或營銷活動的規則。交叉銷售是基于規則的電子商務過濾的一個示例。因為購買了產品Y的客戶也可能對產品x感興趣,“向最近購買產品Y的客戶提供有關產品X的信息”,因此購買了一本書的客戶可能對另一本當前或以前的書感興趣。或該書作者的同一本書按內容過濾推薦相關內容和書籍它也是關于分析一個對象的內容以創建一組訪問者感興趣的對象。通常,這種分析需要您指定一個關鍵屬性集并為每個對象輸入一個值。該技術的一個常見示例是按關鍵字分析文檔的文檔過濾系統。支持購買電影和電視節目是按內容過濾的另一個示例。協同過濾使用顯式或隱式評級來收集觀眾意見。創建一群志趣相投的朋友。查看附近的朋友群。并查找特定訪問者的文章。內容過濾查找具有相似屬性的對象。協同過濾可以找到具有相似品味的訪問者。協同過濾生成的推薦基于對等組的響應。并且不限于簡單的屬性匹配,但是協同過濾需要訪問者對對象進行評分,并向不同的訪問者呈現不同的品味。任何狀況之下有些人有獨特的愛好。所以有些人不會那樣做。有些人會做出極端的決定,而另一些人會做出溫和的決定。這使得你很難組建一個同事小組[21]。2.3基于URL的過濾技術基于URL的過濾技術通過創建不允許或未授權訪問的URL列表來實現此目的。這項技術的好處要么被列入黑名單,要么被列入白名單,這都非常容易,因為每個URL的最終標識都是人工審核的。并由政府機構或相關公司的高級人員提交。誤判沒問題,對于網絡運營商,尤其是網絡運營商。設置網站黑名單是排查不良網站、防止不良信息在互聯網上傳播的有效方法,但這項技術的局限性也很明顯[22]。首先,我們來說一下名單大綱。白名單上的站點數量有限且相對穩定。這使得它對互聯網用戶非常嚴格。并且有必要充分利用互聯網上的海量信息來獲得您想要的內容。因此,適應互聯網的客觀情況是每天都有大量的新網站被創建。只為年幼的孩子對于黑名單方案全球色情網站每天都在創建和消失。這使得廣泛的報道和及時的更新變得困難并在網絡上被列入黑名單。色情是不可避免的。內容提供者可以通過更改網址返回,此外,黑名單方案也無法處理某些官方網站上偶爾出現的不良信息,例如某些網民在其網站上發布的淫穢照片。

第三章軟件需求分析和總體框架設計這個主題開發和使用的這個壞照片過濾軟件的主要特點是該軟件實時檢查每個網站上的圖像,當用戶點擊該網站時。該軟件立即向用戶顯示警告信息。色情網站可以在所有瀏覽器中關閉和關閉。這是因為色情通常與色情網站和信息相關聯。在客戶端阻止色情內容是不夠的。關閉色情網站或完全關閉瀏覽器將阻止用戶在線訪問色情內容。瀏覽器訪問大部分網頁使用的應用層協議是HTTP(如Web超文本傳輸協議),除了HTTP協議,手機使用WAP無線應用協議,傳輸層協議。使用的一種是TCP和這個軟件大多使用糟糕的網絡圖像過濾[23]。通過HTTP協議的Internet正在成為移動Internet訪問的標準。過濾虛假網絡圖像您需要三個稱為圖像檢測程序的功能模塊。網絡監聽模塊和HTTP文本分析模塊,圖片識別機制的作用是判斷導入的圖片是否色情。網絡攔截器的作用是利用TCP協議攔截設備收發的所有網絡數據包。并將其轉發給HTTP數據包分析器進行分析。關閉網頁或瀏覽器。HTTP數據包分析模塊的功能是分析網絡攔截器發送的數據包。判斷是HTTP圖像請求消息還是HTTP圖像響應消息,并從Web圖像文件中提取相關信息。這個軟件的整體框架如圖2.1所示,由于你使用的是WindowsMobile,所以應用開發和Windows32桌面應用開發有很多相似之處,開發過程中必須將OpenCV遷移到WorkwithWindowsMobile。最初安裝基于Windows的桌面瀏覽器是為了方便調試和基準測試。安裝流氓照片過濾軟件。然后將端口過濾器和OpenCV軟件安裝在WindowsMobile平臺上[24]。

第四章基于內容的敏感圖片過濾技術4.1圖片庫的建立按內容過濾敏感圖像可以被視為對圖像的理解和感知的問題。對于圖像的復雜背景條件,很難將所有屬性與一個簡單的代表模型結合起來。光照條件不一致各種形式的圖像分析工具以不同方式基于人體圖像。和色情本身定義這項技術的關鍵是檢測或識別皮膚d-pixel的表面積,并且僅在在此基礎上,我們可以對整個圖像的感覺做出更多的判斷。彩色圖像中的皮膚識別也是人臉識別等應用的重要基礎參考。手勢識別基于生物特征圖像的內容視頻搜索和圖像內容檢查今天,大多數皮膚識別方法都使用皮膚的特定顏色特征。來自眾多統計研究膚色因種族而有很大差異。但是把亮度調到標準后人類的膚色非常相似。并且只占用少量的色彩空間,相似度高,協調性高,可以設計出更好的皮膚/非皮膚分類器,但是圖像中存在多個與膚色顏色相同或相同的物體.膚色過濾器將不可避免地錯誤地將這些對象識別為皮膚。以及相應的分類算法對敏感圖像濾波器進行建模,實現敏感圖像識別。本白皮書中的所有實驗均在實驗庫中進行。它們分為培訓畫廊和測試畫廊。在實驗圖庫中,有2750張照片,分為1450張訓練照片,其中750張是敏感的,700張是正常的。人們在訓練庫中的照片中,只有400張人體皮膚黃黑色區域的照片,只有400張人體皮膚白色區域的照片。測試庫由1300張圖片組成,其中機密圖片700張,普通圖片600張,在測試庫中人們拍攝的照片中,只有400張是人體皮膚的黃黑色區域。以及350張人體皮膚白色區域的照片。4.2掩碼圖像的輔助處理提高從膚色檢測模型得到的蒙版圖像的效果,減少蒙版圖像不必要的劃痕和點。在本文檔中通過使用低通濾鏡增強了圖像遮罩的效果,在本文中,我們使用了改進的5X5濾鏡,通過特寫檢測進行附加處理。蒙版對每個像素執行5X5近距離檢測,如果膚色像素與周圍總像素的比率超過某個閾值,則計算24個周圍像素。(實驗表明,0.65的閾值是最佳的。)像素被認為是膚色,否則像素與皮膚的陰影不同。圖1顯示了未過濾的蒙版和圖像。相比下您會看到過濾后的圖像明顯優于未處理的圖像。4.3紋理檢測模型建立圖4.1采用濾波前后的圖像比較紋理在圖像處理中起著重要作用。模式識別和計算機視覺每個圖像的紋理都以包含重要信息的紋理為特征,例如對象的結構及其與環境的關系。紋理表示圖像中特定圖4.2敏感圖像經膚色模型與紋理模型處理結果圖4.3非敏感圖像經膚色模型與紋理模型處理結果空間結構的特定屬性。這種空間結構的具體屬性可以通過相鄰像素之間的關系來確定。沒有理由談論由單獨像素組成的紋理。定義紋理:(1)GrayscaleCommonsMatrix由像素間距和灰度圖像對齊創建。矩陣紋理(2)您可以將有意義的圖像紋理屬性與tamura屬性區分開來。作為人類心理的主觀度量,Tamura推薦了六種基本表面屬性,如粒度、對比度、方向、線性、周期性和粗糙度。比共存矩陣(3)的小波變換更清楚的是,紋理屬性是從小波變換中提取的統計技術。小波變換可以與其他方法結合使用。為了獲得更好的結果(4)馬爾科夫隨機場模型該方法假設表面是馬爾科夫隨機場形成,并通過局部檢測來描述表面。(空間)和圖像中的相關信息。紋理可以被認為是空間灰度變化產生的圖案。這是圖像真實空間的特定屬性色情作品中的大多數膚色都具有平滑特性。實驗表明,膚色模型感知細膩的圖像。然后根據顏色的相似性歪曲圖像。黃色沙發黃色毯子等是有膚色的區域,也會出現不需要的警報。引入表面模型的主要目的是去除被錯誤識別為皮膚區域的非皮膚區域,同時獲得結果。基于膚色蒙版圖像必須有一定的正向識別率。必須有一個普遍的分類。分類器的過濾功能供以后使用。圖2和圖3分別是使用膚色和紋理模型處理精致和非精致圖像的示例。這清楚地表明了紋理模型正在嘗試做什么。具體方法是先從膚色模型中獲取圖像的膚色區域。然后在該區域中檢測到表面,并移除低于表面模型閾值的區域中的點。高效使用降低誤報率。

第五章網頁內容分級過濾系統設計5.1總體設計用于對Web內容進行分類的基于Web服務的過濾系統具有多種使用模式。本白皮書中使用的系統使用第一種模式,ClientWebServices(C-W)模式,在這種模式下,Web服務允許客戶對網頁進行分類和評分。客戶將根據Web服務返回的結果決定是否允許查看該頁面。在客戶端Web服務調用者的具體實現可能是瀏覽器插件或監控軟件,檢查下面的HTTP數據包。要使用的插件還需要特定的管理功能,例如b.使用。瀏覽器內插件和用戶年齡設定管理從以上分析分級頁面內容過濾系統由IE瀏覽器插件、系統管理模塊、IE瀏覽器插件三部分組成。和網絡服務每個由幾個子模塊組成。客戶端安裝IE瀏覽器插件和系統管理模塊,服務端使用Web服務。Web服務允許客戶過濾網頁的層次結構。并將結果以分類分層標簽的形式返回給客戶端。客戶端的IE瀏覽器插件判斷一個標簽是否跨越了“條件標簽”,以及頁面是通過還是阻止瀏覽。大多數系統管理模塊都知道管理瀏覽器插件等功能。用戶年齡管理、加密和網絡數據庫管理。系統范圍的功能模塊配置如圖4所示。圖5.1網頁內容分級過濾系統層次圖圖中各子模塊的功能如下:加密模塊有兩個功能。一是對最近訪問的網站分類數據庫進行加密,防止用戶誤解和破壞內容。另一種方法是年齡加密,因此父母可以設置年齡密碼,以防止孩子未經允許更改父母設置的年齡。年齡輸入模塊允許用戶輸入年齡并定義。“標準標簽”是合適的。瀏覽器插件管理模塊用于查看插件使用情況,控制是否使用瀏覽器插件。數據庫管理模塊用于管理最近訪問網站的評分數據庫,如查詢、添加和刪除記錄。在這份白皮書中該數據庫使用文本文件存儲最近訪問的30個網站的訪問日期、URL和相關評級信息。記錄還按訪問日期排序。并且訪問日期越近職位越高網頁內容提取模塊的作用是提取網頁的文本內容,即從HTML文件體中去除HTML標簽后留下的內容,生成Web服務字符串。一個Web服務模塊,它調用Web服務作為客戶端調用對象,并將網頁內容作為調用參數發送到Web服務。標簽比較模塊將頁面標簽與定義頁面選擇的“標準標簽”只要頁面標簽高于“條件標簽”級別,就無法打開頁面。頁面渲染模塊根據頁面渲染模塊返回的結果控制瀏覽器1E的渲染頁面。比較標簽如果允許文本該消息將成功運行,您將看到您正在訪問的網頁。否則它不會顯示或網頁將被重定向到警告頁面。每個分類級別映射模塊主要用于基于從關鍵字組合獲得的布爾模型對網頁內容進行分類和評級。該模塊是整個系統的核心模塊。而分層過濾算法決定了Web服務的核心性能,即過濾的準確性,從而決定了整個系統的效率。標簽返回模塊的作用是結合類別和層次。作為網頁標簽輸入并返回給客戶端。5.2分級過濾系統客戶端設計正如剛才提到的系統客戶端由兩部分組成:IE瀏覽器插件和管理工具。為了使用InternetExplorer(1E)瀏覽器實時監控客戶端的網頁內容,網頁內容分級過濾系統客戶端過濾軟件采用IE插件的形式。獨立應用程序。IE插件是IE綁定的DLL,它通過IE事件監控瀏覽器窗口并執行必要的動作。以下指導IE插件的設計。用于基于IE瀏覽器事件過濾系統以及本文檔中DLL的原理和使用,描述了系統管理程序的設計。圖5.2IE的主要事件WebBrowser控件由四個接口組成:IWebBrowser.IWebBrowserAPP、IWebBrowser2和DWebBrowserEvents2。IWebBrowser是唯一一個接口,最初代表WebBrowser控件并提供瀏覽功能的基礎知識,例如漫游到網頁或導航漫游記錄等.1WebBrowserAPP表示IE窗口的一個實例,通常控制瀏覽器窗口的用戶界面功能,例如狀態欄、工具欄和菜單欄。IWebBroser2繼承自IwebBrowser和IWebBrowserAPP。它還提供了兩者都沒有的功能。因此,1E校驗和應該使用IWebBrowser2接口。IWebBrowser2方法和屬性提供了一些導航和用戶界面控件。但是即使你不控制瀏覽器做什么:當它控制時,你也沒有完全的控制權。因此,IE使用了一種“事件”機制,事件可以在特定時間觸發并與之交互。這是通過一個編程接口。圖5.2顯示了IE的一些里程碑。在4.0版本中,IE通過該接口發送事件。DWebBrowserEvents2您可以通過控制IE事件來監視和執行必要的操作。5.3使用BHO監控IE瀏覽器每個IE實例啟動時它在注冊表中搜索唯一鍵(HKEYLOCALMACHINE\SOFTWAREWIicrosoft\Windows\CurrentVersion\Explorer\BrowserHelperObjects),如果找到該鍵,則為瀏覽器助手對象鍵下列出的每個CLSID(類標識符)。注冊表中的瀏覽器在實例化瀏覽器時,IE調用CoCreateInstance。在與相應瀏覽器實例相同的進程空間中創建BHO實例。換句話說,IE是BHO的一個正在進行的COM服務器,這意味著每次創建瀏覽器窗口時。該對象的一個新實例被創建。所有BHO實例與瀏覽器實例同時創建和銷毀。創建BHO程序時,IE為IWebBrowser2指針提供了一個BHO,BHO可以使用指針控制IE實例,記錄相關事件。跟蹤用戶的在線管理過程。并做出決定和過濾網頁內容。請注意,BHO僅在InternetExplorer4.0及更高版本中可用,WindowsExplorer也支持BHO。第一步在D11Main()編碼過程中完成,當WindowsExplorer調用DLL進程時,D11Main()函數返回False并停止加載。第二步,獲取SetSite()方法的WebBrowse對象的指針,要攔截瀏覽器觸發的事件,需要BHO通過接口與瀏覽器連接。連接點并將函數表發送到IDispatch以處理事件。此過程包括調用IConnectionPoint的Advise()方法。通知瀏覽器BHO將收到有關該事件的通知。在COM事件處理引擎中,這是BHO,它為瀏覽器提供指向IDispatch接口的指針。瀏覽器調用IDispatch的Invoke()方法,將事件ID作為第一個參數傳遞。一旦給出ID,您就知道事件是什么。最后,您需要注冊您的BHO。BHO是一個COM服務器,它必須同時向COM服務器和COM服務器注冊。BHOATL模板提供注冊腳本(RGS)代碼來完成初始注冊。通過將代碼寫入rgs文件來完成BHO注冊。IE瀏覽器插件在發生時通過BHO記錄IE事件。BeforeNavigate2對用戶輸入的URL進行分析,驗證如果URL中包含edu、gov等,則表明該網站不包含惡意信息。并且訪問信息會直接發送到頁面的標簽文件中進行更新。否則會查詢頁面的標簽文件,如果文件中有URL,則需要將頁面的標簽與“頁面標簽”標簽進行比較。標準如果它不包含在頁面標記文件中。事件發生時標志設置為1文檔完成發生且查詢標志為1,提取網頁內容并調用Web服務以獲取Web側標簽。還執行日常比較和標簽文件更新。BHO中止。從OnQuit事件發生時的瀏覽器。管理程序是獨立的應用程序,主要用于幫助用戶管理瀏覽器插件。年齡設定并訪問網站數據庫管理和其他功能首先管理瀏覽器插件的主要目的是讓用戶更好地控制他們是否使用插件來過濾網站。您可以通過設置年齡來更改年齡。并且您還可以添加密碼設置功能。首先管理瀏覽器插件的主要目的是讓用戶更好地控制他們是否使用插件來過濾網站。年齡設置功能允許用戶設置或更改用戶的年齡。并相應地設置適當的“閾值標志”。管理您的網站數據庫應該允許您搜索和編輯記錄、標記記錄以及創建其他信息。對于最近訪問的網站您必須允許用戶查詢和添加特定網站的記錄(例如通過直接認證)。當然,該程序還提供密碼管理。因為使用這些功能需要密碼認證權限。管理程序的使用是免費的。因此,您可以根據上述功能設計附加功能。在本文使用的系統中這個程序只知道一些功能。并且需要在未來進一步改進和改進。此外,本文檔中設計的系統該程序還集成了IE瀏覽器工具欄上的按鈕,讓用戶可以輕松啟動系統管理應用程序。當我按下我單擊的按鈕時,管理程序將打開。

第六章圖像檢測模塊設計、實現與測試6.1OpenCV概述OpenCV是一個免費的開源計算機視覺平臺,用C/C10編寫,由英特爾公司提供支持。這是一個開源的計算機視覺庫許多常用算法用于圖像處理和計算機視覺。它涵蓋了廣泛的應用,例如對象檢測。圖像分割視頻處理人臉識別人機交互結構分析運動分析以及相機標定和目標跟蹤。例如,OpenCV可以運行在Windows、Linux、Mac和其他操作系統上。OpenCV主要專注于實時應用程序。因此,它的設計目的是盡可能快地運行。另外,對于Intel處理器,您可以購買并安裝IPP(IntegratedPerformancePrimitives)來加速OpenCV,加速的效果很重要。OpenCV用于圖像處理的C算法和函數非常廣泛。不依賴外部庫正確完成后您通常可以編譯和鏈接以創建可執行文件而無需添加外部幫助。ElOpenCV將BSD許可證用于非商業目的。應用程序和商業應用程序都是免費的,作為OpenCV算法的一個端口被廣泛使用。第一個開源版本于2000年發布,第一個正式版本于2006年發布。隨著OpenCV1.0的最新版本是OpenCV2.20,它是于2010年發布,但沒有OpenCV的二進制版本,也沒有直接源代碼。它與WindowsCE和WindowsMobile一起使用。如果您想在WindowsCE和WindowsMobile上使用OpenCV,您需要重新編譯OpenCV源代碼對創建二進制庫文件進行了細微更改,您可以在WindowsCE和WindowsMobile中使用,以方便調試和基準測試。本文檔首先使用OpenCV2.1安裝Windows上可用的圖像識別模塊。桌面使用的Windows桌面版本在開發過程中是WindowsXPSP3。6.2圖像檢測模塊及其在Windows上的實現本文檔中的圖像識別模塊最終會部署到手機上。和手機硬件要求性能(尤其是處理器頻率和內存大小)很難與臺式機相比,因此圖像識別模塊的設計并不太復雜。然而,一個過于簡單的決定會對陽性率和假陽性率產生負面影響。此外,由于OpenCV2提供的功能,本文中的色情識別主要使用四個步驟:人臉識別白平衡校正皮膚識別和SVM分類、照片和符號,以提高識別性能。流程圖如圖5所示。圖6.1圖像檢測模塊的流程圖6.2.1人臉檢測網上有很多人臉照片。您可以使用人臉檢測效果來排除人臉面積與圖像總面積之比超過某個閾值的圖像。并避免僅基于皮膚檢測的誤報。如果同時在圖片中檢測到人臉人臉區域可以用來校正圖像的淺色背景,也就是說,白平衡是正確的。穆文使用OpenCV使用的ViolaJones檢測器,帶有類似頭發的功能進行人臉識別。雖然檢測器適用于檢測前面的人臉。但它不適合輪廓人臉檢測。由于配置文件的人臉觀察視圖模板變化較多,木問只進行人臉識別。檢測過程的兩個主要函數是cvLoad()和cvHaarDetectObjects(),cvLoad()函數是加載一個參數定義的分類器。以及派生函數的函數cvHaarDetect0ects()是使用參數定義的分類器和檢測定義的圖像。返回識別結果。這兩個功能是所有圖像模塊乃至整個軟件中最耗時的兩個功能。并且是實時限制軟件整體性能的關鍵。您可以調整這兩個函數的參數,以在性能和實時精度之間取得平衡。本文使用的模型文件是經過訓練的正面檢測器。選擇這個模型文件是因為它是OpenCV最小和最快的人臉分類器。6.2.2皮膚檢測皮膚檢測是幾乎所有基于視覺內容的色情圖像識別系統的重要步驟。這是因為大面積裸露的皮膚是大多數色情作品的共同特征。木紋紋理檢測主要基于膚色和紋理。顏色屬性對旋轉或平移的變化不敏感。所以它非常有效,您可以在色彩空間類別中包含人類膚色。因此,要有效識別人體皮膚的顏色,就需要使用膚色。多項研究表明,膚色主要由血紅素和黑色素水平決定。白色、黃色和黑色等種族之間的色調差別不大,差別來自黑色素。由于內容的不同而導致的亮度和飽和度的差異下面是一個簡短的介紹。關于色彩空間和本文中使用的一些色彩空間概念。顏色空間是一種定量描述顏色的數學方法。這通常用3D模型來表示,每種顏色可以用3個參數的3D坐標來表示,RGB顏色是人類最常用的顏色空間。根據紅(紅)、綠(綠)、藍(藍)原理,每一種都可以由不同比例的紅、綠、藍三種基本顏色組成。CIE紅、綠、藍單色光的波長為3D坐標中分別為700nm、X46.1nm和435.8nm。RGB顏色是立方的,如圖6所示。RGB是與顯示器和相機中經常使用的設備相關的顏色空間。圖6.2RGB顏色空間模型對于人類來說,色調、飽和度和亮度通常用于定義顏色。因此,顏色在HSB顏色空間中,取決于可見光波長的陰影是區分顏色最容易的屬性。從長波長到短波長一系列自然色調的紅色、橙色、黃色、綠色、藍色、靛藍和紫色形成了色輪。陰影與顏色的明暗無關。飽和度是指顏色的純度。完全飽和的顏色,沒有白光。更多的輕元素多少流入油漆飽和度越低,顏色越低。亮度是指人眼對可見物體發出或反射多少光的感知,例如,點燃的蠟燭在較暗的地方比白熾燈更亮。亮度與輻射功率有關。在3D坐標中,HSB顏色空間是一個六邊形金字塔。YCbCr色彩空間一般用于JPEG圖像壓縮、MPEG視頻壓縮、DVD、攝像機、數字電視等。Y代表Luminance。(光度或亮度),它是由以這種方式反射的光譜靈敏度函數加權計算的輻射功率。如您所見,從人類的視覺來看,它更輕。上述亮度和光度的概念是密切相關的,而且Cb和Cr是代表色差的兩種顏色元素,Cb指的是藍色分量的偏移量,Cr表示偏移量。紅色的分量集,計算機的YCbCr和RGB分量,用8位二進制格式表示,它們的取值范圍是0到255。可以使用膚色模型得到一個二值遮罩圖(本文稱為binImg),一個binlmg是一個單通道8位圖像,高寬與原圖相同,binImg像素面標注為255,并且像素表面被命名為255。但是,在捕獲過程中為0。由于光線不均勻等外部條件的干擾,人體皮膚可能會出現在物體的背景中。顏色類似于一個小場景。所以背景應該是第一位的,噪聲、人體空間、粗糙的邊緣等,如果采用特定的方法來消除這些因素的干擾。皮膚檢測的準確性大大提高,本文在圖像形態學中選擇了排除侵蝕、腫脹、開閉的方法。和之前得到的binImg的二值掩模圖像來分隔小區域的連續區域,以避免特定的干擾。所謂侵蝕調色板是指確定任何形狀和大小的核心。之前和帶有參考點(錨點)(通常一個軸是一個以幾何中心為參考點的小實心正方形)或一個小的填充圓。內核的內核是滾動圖像全部或部分的掩碼或模板。當前內核所覆蓋的具有最低像素值的區域被用作相關圖像的每個像素的值。參考腐蝕操作可以在二值和灰度圖像上執行。這個過程被稱為侵蝕,因為它在圖像中向內切割對象的邊緣。在OpenCV中,可以通過函數來完成自定義內核生成。cvCreateStructurinElementEx()和腐蝕操作可以通過cvErode()函數執行。它使用當前內核覆蓋區域中的最大像素值作為參考點處相應圖像像素的值。這種操作稱為填充,因為它在圖像中將對象的邊緣向外擴展。在OpenCV中,可以使用cvDilate()函數執行高級操作。6.3圖像檢測模塊及其在Windows上的測試之前開發的圖像識別模塊在筆記本電腦上用筆測試了性能。測試平臺配置如下:IntelPentium雙核T2330處理器,主頻1.66GHz,1條GDDR2內存;硬盤1206SATA;WindowsXP操作系統服務包3本文檔選取200張淫穢圖片和400張色情以外的圖像是猜測。平均圖像分辨率為465(寬)x434(高)像素,整幅圖像的寬高超過100像素,每張圖像的平均檢測時間為0.19s,檢測時間包括圖像文件讀出時間。人臉檢測時間。白平衡校正時間皮膚檢測時間SVM分類時間,但是是人臉分類器和SVM分類器的加載時間和分類器加載時間。每張圖像的平均檢測時間為0.24s,正檢出率為88%,誤報率為9%,正誤率定義如下。陽性檢測率2正確分類的色情內容數量/(錯誤分類的色情內容數量,包括錯誤分類的色情內容)誤報率=圖片數量。正確分類的非色情內容/正確分類的非色情圖片數量一些色情圖片與非色情照片混淆的主要原因是:照片中的裸體人體占照片總面積的比例非常小,例如一張裸體人體的遠程照片。A.照片中的人在做愛時穿了很多衣服。一些非色情圖片被誤認為色情的主要原因是因為該人的衣服顏色與其膚色相似,并且表面光滑。圖像的大背景區域與膚色相似,具有光滑的質感。

第七章瀏覽器過濾軟件的設計7.1LSP技術相關模塊向WindowsMobile移植LSP技術不僅在桌面Windows上受支持,而且在WindowsMobile上也受支持。但是,在WindowsMobile上使用LSP技術與在桌面Windows上使用它有點不同,因此您需要對桌面Windows上的等效代碼進行微小的更改才能使其在WindowsMobile上運行。(1)WSCWriteProviderOrder()函數在LSP安裝在可執行程序中時使用,該程序為桌面Windows上的用戶啟用或禁用過濾功能,但在WindowsCE和WindowsMobile上使用但不支持此函數。該函數的作用是對Winsock目錄G中可用的傳輸服務提供者(包括BSP和“P”)進行排序。如果使用WSCInstallProvider()函數在winsock目錄下安裝一個新的LSP,然后使用WSCEnumProtocols()函數枚舉,這個LSP默認會出現在winsock目錄的末尾。在Winsock目錄中實現LSP的DLL的位置決定了它是直接從Ws232.411(WindowsCE和WindowsMobile上的Ws2.d11)加載還是從另一個LSP加載。如果LSP在winsock目錄的頂部,或者如果LSP不在winsock目錄的頂部但上面沒有其他LSP,則直接從Ws2_32.411或Ws2.d11加載。否則,安裝的LSP默認情況下可能不會被調用,因為它是由父LSP加載的。您可以使用WSCWriteProviderOrder()函數在Winsock目錄的頂部顯示新安裝的LSP,以便您可以直接從Ws232.411或Ws2訪問它。加載d11。WindowsMobile不支持WSCWriteProviderOrder()函數,因此在移植到WindowsMobile時,請從可執行文件中刪除Winsock目錄重新排序的相關部分,該部分為用戶提供啟用和禁用過濾功能。對于運行WindowsMobile6的手機按照上面的步驟,大多數情況下LSP安裝后就可以過濾掉,而無需重新排列winsock目錄。WindowsMobile也有一個優勢,解決這個問題的方法就是放棄啟用或禁用用戶的能力。過濾函數的可執行程序可以在LSP動態鏈接庫上電時自行加載。具體程序如下。在LSP動態鏈接庫中添加一個名為D11RegisterServer()的函數,將其導出并在D11ReisterServer()函數中實現LS。由P安裝。您還需要向注冊表添加一個子項。將HKEYLOCALMACHINE\COMM\WS2\LSP鍵和DII、Order、Entry等條目添加到此子鍵(條目)。這是這個LSP動態鏈接庫I。順序條目可以指定這個LSP的加載順序。也就是說,winsock目錄中的LSP錯誤,其行為類似于WSCInstallProvider()函數。輸入欄i是install函數的入口點,默認h是D11RegisterServer。當設備以這種方式以11"啟動時,LSP會自動將設備加載到Winsock目錄中的指定位置。在WindowsMobile上,您應該避免在中間加載或卸載LSP,因為您可能會遇到意外錯誤。如果要打開和關閉提供過濾功能的可執行程序,請將可執行程序放在\\Windows\Autostart文件夾中,當系統開始加載LSP時,可執行程序會自動運行。桌面Windows在LSP安裝期間使用UuidCreate()函數來生成全局A標識符(GUID),該標識符可以實現與WindowsMobile相同的功能,并由帶有CoCreateGuid的WindowsMobile支持。()中不支持。應改為使用。功能。使用WindowsMobileWSPStartup()函數加載基本服務提供者時,不能使用WSCGetProviderPath()函數獲取基本服務提供者DLL的路徑,必須直接在此處指定基本服務提供者DLL的絕對路徑。LoadLibrary()函數(通常是\Windows\wspm.dll)。這是因為WindowsMobile不支持WSCGetProviderPath()函數。7.2WindowsMobile手機瀏覽器不良圖片過濾軟件的測試與改進這個針對手機瀏覽器的爛端口圖片過濾軟件已經在真實WindowsMobile上測試過了,選用的WindowsMobile手機配置如下:處理器為高通(Qualcomm)MSM7201A,架構為ARM11+ARM9DualCore。頻率為X28MHz,內存為288MBRAM+26MBROM+4GB存儲卡,“”,203MB程序內存,64MB工作內存,VGA屏幕分辨率480x640像素。操作系統為WindowsMobile6.1Professional并且測試的瀏覽器是IEMobile。一是過濾速度慢。當圖像識別引擎的檢測過程使用皮膚檢測時人臉檢測和SVM分類,從查看色情網頁到顯示警告對話框的平均時間接近5秒,這當然是由于移動設備的硬件要求有限。其次,軟件不夠穩定,加載LSP后,瀏覽器可能無法訪問網頁。確切原因尚不清楚。這可能與Winsock目錄中LSP的安裝順序有關,或者可以假設LSP的動態鏈接庫需要特權數字簽名。加快色情過濾。圖像檢測過程只能檢測皮膚而不使用人臉檢測,這樣從查看色情網頁到查看警告對話框平均不到2秒。面部識別大大增加了誤報率。

第八章總結本白皮書認真推動了良好的網絡環境。注意網頁內容的分類和過濾。并敦促社會保護兒童免受互聯網上有害內容的侵害。該創新是基于國籍、誠信、國籍的“中國教育內容評估標準”,提

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論