




版权说明:本文档由用户提供并上传,收益归属内容提供方,若内容存在侵权,请进行举报或认领
文档简介
自然語言浮水印(NaturalLanguageWaterMarking)InternationalWorkshoponDigitalWatermarkingIWDW2003自然語言浮水印(NaturalLanguageWater1WhatisNLWatermarking文字數位浮水印技術資訊市場情報中心著作權所有
版權資訊原文將浮水印加入數位文字內容中,此浮水印技術與文字的內容語意相關而無關於文字儲存的格式,可以加強數位文字內容的保護。加入浮水印之後的文章WhatisNLWatermarking文字數位資訊市2浮水印技術規格透明性(transparency)被加入浮水印(watermark)須感官上(perceptually)看不見(invisible)或聽不到(inaudible)亦即無法察覺(imperceptible)以免影響原來資訊的品質。
非偵測性(undetectability)所加入的浮水印須無法被偵測出其位置,以免被不法者輕易剪下而移除。強健性(robustness)安全的浮水印需能忍受各種數位處理與攻擊(attacks)以維持其功能,或者至少在其被破壞前原始影像已嚴重失真。安全性(security)即使知道加入的浮水印的程序也無法讓未經授權者移除所加入的浮水印。非模糊性(unambiguousness)解決合法擁有者死結的問題,亦即確認唯一合法擁有者。鑑定時勿需原始影像(authenticationwithoutoriginalsource)
浮水印技術規格3浮水印示意圖文字(Doc,Txt…)密鑰加密後語意不變修改後之文字浮水印解析公開發表第三者修改公開發表23456浮水印植入1使用者上載2005我於台北發表2005我於台北發表浮水印示意圖文字(Doc,Txt…)密鑰加密後語意不變修改後4自然語言浮水印-研發規格說明詞彙分析技術:發展一句子語意解析技術,了解句子中的語意,包含斷詞、詞性標記與詞彙分析技術等功能。語句句型解析技術:發展一語句技術分析是那一種句型,再依照不同的句型解析成不同句型樹。句子選擇技術:發展一句子選擇技術,從文件中分析語句得重要性已選擇適當的句子。浮水印encoding技術:發展一浮水印encoding技術,將欲植入的浮水印分解成小部分,分別植入選定的句子中。而此浮水印encoding技術採用密鑰(encryptionkey)approach,只有在獲得密鑰(encryptionkey)以及encoding後的文章才可解析浮水印。發展一句型替換技術,將語句的語意保留而進行不同句型的替換,替換的方式包括同義詞與同義句型樹替換。自然語言浮水印-研發規格說明詞彙分析技術:5自然語言浮水印技術突破句型替換技術:同義詞替換以ACTthesaurus為基礎之同義詞替換同義句型替換ZeroAnaphora技術研發Co-Reference技術研發浮水印encoding技術:以同義詞替換方法為基礎之資訊隱藏方法二元樹分法,可隱藏logn個bit,n為同義詞個數。完成以同義詞替換為主的浮水印加密方式自然語言浮水印技術突破6植入文字格式數位浮水印流程圖文字格式數位浮水印研發技術創新前瞻語意利解搜尋引擎既有成果斷句技術OriginalTextContent句子詞彙解析技術語句句型解析技術句型替換技術浮水印Encoding技術句子選擇技術WatermarkedTextContentWatermarkencryptionkey中文語料庫知網知識庫中文句結構樹資料庫分詞及詞性標注系統Parser同義中文結構樹關聯資料庫同義詞庫Actthesaurus植入文字格式數位浮水印流程圖文字格式數位浮水印研發技術創新7文字格式數位浮水印技術-詞彙分析技術了解句子中的語意,當進行Watermarkencoding時便能維持文字中的語意斷詞與詞性標記中研院分詞及詞性標注Autotag系統詞彙分析知網(HowNet)
創新前瞻語意搜尋引擎計畫中所研發的”ACTthesaurus”
文字格式數位浮水印技術-詞彙分析技術了解句子中的語意,當進行8文字格式數位浮水印技術-語句句型解析技術(續)同義中文結構樹關聯技術:由於選定做Watermarkencoding的句子的結構不一定能將Watermarkencoding在此結構中,需保留句子的語意並且更改句子的結構文字格式數位浮水印技術-語句句型解析技術(續)同義中文結構樹9文字格式數位浮水印技術-句子選擇演算法(續)
句子重要性分析技術:原因一篇文章中句子數目眾多,浮水印的資訊有限,不可能每一句子都encoding浮水印資訊於其中。侵權者往往只會盜用重要的句子。增加浮水印之彈性。計算句子資訊量的方法,計算每一句的資訊量,資訊量高的句子假設為重要的句子文字格式數位浮水印技術-句子選擇演算法(續)句子重要性分析10文字格式數位浮水印技術-句子選擇演算法句子排序技術:將句子做一排序,以決定浮水印的每一小部分資訊encoding到句子中的順序,這樣可保護浮水印資訊不容易被偵測與不容易被破壞。文字格式數位浮水印技術-句子選擇演算法句子排序技術:將句子做11文字格式數位浮水印技術-句型替換演算法當選定做Watermarkencoding的句子不符合時,可將此句的語意保留而進行不同句型的替換。
文字格式數位浮水印技術-句型替換演算法當選定做Waterma12文字格式數位浮水印技術-句型替換演算法(續)
同義詞替換技術:
知網(HowNet)與”ACTthesaurus”所定義之詞義,進行詞之相似度計算建立同義詞庫。文字格式數位浮水印技術-句型替換演算法(續)同義詞替換技術13文字格式數位浮水印技術-句型替換演算法(續)同義中文結構樹轉換技術:當Watermark要encoding到選定句子的結構樹之結構中,而結構樹的結構不符合時,將語意保留而進行不同句型的替換。利用『同義中文結構樹關聯技術』所建立出來的同義結構樹進行替換
文字格式數位浮水印技術-句型替換演算法(續)同義中文結構樹轉14文字格式數位浮水印技術-浮水印encoding技術
發展一浮水印encoding技術,將欲植入的浮水印分解成小部分,分別植入選定的句子中,而即使知道加入的浮水印的encoding程序,未經授權者也無法移除所加入的浮水印。此浮水印encoding技術採用密鑰(encryptionkey)approach,只有在獲得密鑰(encryptionkey)以及encoding後的文章才可解析浮水印。文字格式數位浮水印技術-浮水印encoding技術發展一浮15文字格式數位浮水印技術-浮水印encoding技術(續)浮水印分解技術:將欲植入的浮水印分解成小部分,分別植入選定的句子結構樹之結構中。Unicode轉換
自然語言實驗室10000111010011101Unicode文字格式數位浮水印技術-浮水印encoding技術(續)浮水16文字格式數位浮水印技術-浮水印encoding技術(續)浮水印植入技術:將經過分解過後的浮水印資訊的每一小部分,分別Encoding到選定的句子樹狀結構中。WatermarkUnicode轉換10011…1Bit轉換Bit轉換Bit轉換句子1句子2句子n...EncryptionkeyEncryptionkeyEncryptionkey1010…0110…0010…MatchMatchMatchYesYesno成功成功句型替換文字格式數位浮水印技術-浮水印encoding技術(續)浮水17文字格式數位浮水印技術-浮水印encoding技術(續)浮水印解析技術:為浮水印植入技術的一個反向操作滿足就算知道Encoding的方式,只有拿到Encoding用的密鑰(encryptionkey)以及encoding後的文章才可解析浮水印
文字格式數位浮水印技術-浮水印encoding技術(續)浮水18QuadraticResidue
二次殘差(quadraticresidue)QuadraticResidue
19目前做法找一質數p,產生QuadraticResidueTable123456...IsQuadraticResidue?111101…QuadraticResidue:1QuadraticnonResidue:0目前做法找一質數p,產生QuadraticResidu20同義句型替換同義句型替換21目的維持一句子的語意,而將句子的結構(句型)進行替換(換句換說)。目的維持一句子的語意,而將句子的結構(句型)進行替換(換句換22同義句型替換-Zeroanaphoran≠m他買了一顆蘋果,很新鮮。他買了一顆蘋果,蘋果很新鮮。VPVHDfa很新鮮SVPVHDfa很新鮮NPNa蘋果S同義句型替換-Zeroanaphoran≠mVPVH23同義句型替換-CoReference代名詞以其所指涉之名詞替換張三是老師,他教學很認真。張三是老師,張三教學很認真。SVPDfa很VH認真NPNh他VA教學SVPDfa很VH認真NPNb張三VA教學同義句型替換-CoReference代名詞以其所指涉之名詞替24同義句型替換-CoReference(Con.)代名詞(名詞)以其所指涉之(名詞+屬性)替換張三是老師,同時,他也是一位好爸爸。張三是老師,同時,張三老師也是一位好爸爸。SNPNf位NPNh他Neu一D也SHI是NPNa爸爸VH好NPSNPNf位NPNb張三Neu一D也SHI是NPNa爸爸VH好NPNa老師同義句型替換-CoReference(Con.)代名詞(名25同義句型替換-以Grammar分析為基礎之同義句型替換分析中文Grammar以獲得各種同義句型替換規則。並列連接詞(Ca)關聯連接詞(Cb)…需有中文人才支援整理出各種Grammar轉換ruleRule如何套用在同義句型替換?寫死在程式中?發展一套用rule的adapter同義句型替換-以Grammar分析為基礎之同義句型替換分26並列連接詞(Ca)
並列連接詞連接兩個概念相似的成分,形成向心式結構,組成成分的作用與其連接成分相同。對等連接詞(Caa)並列連接詞(Ca)並列連接詞連接兩個概念相似的成分,形成向27關聯連接詞(Cb)
「一般關聯連接詞」存在有前後相對的連接詞(e.g.因為~所以~)。我因為生病了所以媽媽不給我出去玩我生病了所以媽媽不給我出去玩媽媽不給我出去玩是因為我生病了XY雖然可是因為所以縱然何況如果
那麼
除非
否則
與其
不如
要麼
不麼
非但
而且
首先
其次
關聯連接詞(Cb)「一般關聯連接詞」存在有前後相對的連接詞28以同義句型替換方法為基礎之資訊隱藏方法以同義句型替換方法為基礎之資訊隱藏方法29EncodingWatermarkinTreeStructure以詞性與structure為依據。依照詞性標上對應之數字利用DFS,BFS將數字連接起來一個Treestructure,兩個”很大的數”。可以利用“and”,“or”,“xor”…等bitoperation增加其encodingbit的能力。將所得到的”很大的數”利用bitoperation合併之後modP(Key)去查table。EncodingWatermarkinTreeStr30自然语言浮水印(Natural-Language-Water-Marking)课件31DFS1547021718470847154747BFS47024715471547081718Bitoperation21232512346235ModP&Lookuptable1DFS1547021718470847154747BFS4732435241241241241BitoperationModP&Lookuptable0435241241241241BitoperationMo33浮水印評量標準透明性PSNR資訊隱藏量互斥條件強健性透明性容量1longn攻擊同義字替換句子語意結構樹之替換部分句子取用句子順序掉換新增/刪除句子竄改偵測RetrievalWatermarkratioNormalCorrectionGaussiansequence浮水印評量標準透明性34未來應用的情境TextwatermarkingDatahiding使用者輸入一文章、密鑰,與一訊息,系統自動將訊息隱藏於文章中,而文章的語意不變。SubSetofwatermarkingSearchengineforplagiarizedtexts使用者輸入一篇文章,系統自動於Internet中替使用者搜尋,涉嫌抄襲的文章。未來應用的情境Textwatermarking35文件中隱藏之資訊Searchengineforplagiarizedtexts文字(Doc,Txt…)系統密鑰使用者上載文件涉嫌抄襲之文章浮水印解析123A網路上之文件文件中隱藏之資訊KnowledgeBase浮水印解析B匯入知識庫比對文件中隱藏之資訊Searchengineforplag36謝謝~~請指教謝謝~~請指教37自然語言浮水印(NaturalLanguageWaterMarking)InternationalWorkshoponDigitalWatermarkingIWDW2003自然語言浮水印(NaturalLanguageWater38WhatisNLWatermarking文字數位浮水印技術資訊市場情報中心著作權所有
版權資訊原文將浮水印加入數位文字內容中,此浮水印技術與文字的內容語意相關而無關於文字儲存的格式,可以加強數位文字內容的保護。加入浮水印之後的文章WhatisNLWatermarking文字數位資訊市39浮水印技術規格透明性(transparency)被加入浮水印(watermark)須感官上(perceptually)看不見(invisible)或聽不到(inaudible)亦即無法察覺(imperceptible)以免影響原來資訊的品質。
非偵測性(undetectability)所加入的浮水印須無法被偵測出其位置,以免被不法者輕易剪下而移除。強健性(robustness)安全的浮水印需能忍受各種數位處理與攻擊(attacks)以維持其功能,或者至少在其被破壞前原始影像已嚴重失真。安全性(security)即使知道加入的浮水印的程序也無法讓未經授權者移除所加入的浮水印。非模糊性(unambiguousness)解決合法擁有者死結的問題,亦即確認唯一合法擁有者。鑑定時勿需原始影像(authenticationwithoutoriginalsource)
浮水印技術規格40浮水印示意圖文字(Doc,Txt…)密鑰加密後語意不變修改後之文字浮水印解析公開發表第三者修改公開發表23456浮水印植入1使用者上載2005我於台北發表2005我於台北發表浮水印示意圖文字(Doc,Txt…)密鑰加密後語意不變修改後41自然語言浮水印-研發規格說明詞彙分析技術:發展一句子語意解析技術,了解句子中的語意,包含斷詞、詞性標記與詞彙分析技術等功能。語句句型解析技術:發展一語句技術分析是那一種句型,再依照不同的句型解析成不同句型樹。句子選擇技術:發展一句子選擇技術,從文件中分析語句得重要性已選擇適當的句子。浮水印encoding技術:發展一浮水印encoding技術,將欲植入的浮水印分解成小部分,分別植入選定的句子中。而此浮水印encoding技術採用密鑰(encryptionkey)approach,只有在獲得密鑰(encryptionkey)以及encoding後的文章才可解析浮水印。發展一句型替換技術,將語句的語意保留而進行不同句型的替換,替換的方式包括同義詞與同義句型樹替換。自然語言浮水印-研發規格說明詞彙分析技術:42自然語言浮水印技術突破句型替換技術:同義詞替換以ACTthesaurus為基礎之同義詞替換同義句型替換ZeroAnaphora技術研發Co-Reference技術研發浮水印encoding技術:以同義詞替換方法為基礎之資訊隱藏方法二元樹分法,可隱藏logn個bit,n為同義詞個數。完成以同義詞替換為主的浮水印加密方式自然語言浮水印技術突破43植入文字格式數位浮水印流程圖文字格式數位浮水印研發技術創新前瞻語意利解搜尋引擎既有成果斷句技術OriginalTextContent句子詞彙解析技術語句句型解析技術句型替換技術浮水印Encoding技術句子選擇技術WatermarkedTextContentWatermarkencryptionkey中文語料庫知網知識庫中文句結構樹資料庫分詞及詞性標注系統Parser同義中文結構樹關聯資料庫同義詞庫Actthesaurus植入文字格式數位浮水印流程圖文字格式數位浮水印研發技術創新44文字格式數位浮水印技術-詞彙分析技術了解句子中的語意,當進行Watermarkencoding時便能維持文字中的語意斷詞與詞性標記中研院分詞及詞性標注Autotag系統詞彙分析知網(HowNet)
創新前瞻語意搜尋引擎計畫中所研發的”ACTthesaurus”
文字格式數位浮水印技術-詞彙分析技術了解句子中的語意,當進行45文字格式數位浮水印技術-語句句型解析技術(續)同義中文結構樹關聯技術:由於選定做Watermarkencoding的句子的結構不一定能將Watermarkencoding在此結構中,需保留句子的語意並且更改句子的結構文字格式數位浮水印技術-語句句型解析技術(續)同義中文結構樹46文字格式數位浮水印技術-句子選擇演算法(續)
句子重要性分析技術:原因一篇文章中句子數目眾多,浮水印的資訊有限,不可能每一句子都encoding浮水印資訊於其中。侵權者往往只會盜用重要的句子。增加浮水印之彈性。計算句子資訊量的方法,計算每一句的資訊量,資訊量高的句子假設為重要的句子文字格式數位浮水印技術-句子選擇演算法(續)句子重要性分析47文字格式數位浮水印技術-句子選擇演算法句子排序技術:將句子做一排序,以決定浮水印的每一小部分資訊encoding到句子中的順序,這樣可保護浮水印資訊不容易被偵測與不容易被破壞。文字格式數位浮水印技術-句子選擇演算法句子排序技術:將句子做48文字格式數位浮水印技術-句型替換演算法當選定做Watermarkencoding的句子不符合時,可將此句的語意保留而進行不同句型的替換。
文字格式數位浮水印技術-句型替換演算法當選定做Waterma49文字格式數位浮水印技術-句型替換演算法(續)
同義詞替換技術:
知網(HowNet)與”ACTthesaurus”所定義之詞義,進行詞之相似度計算建立同義詞庫。文字格式數位浮水印技術-句型替換演算法(續)同義詞替換技術50文字格式數位浮水印技術-句型替換演算法(續)同義中文結構樹轉換技術:當Watermark要encoding到選定句子的結構樹之結構中,而結構樹的結構不符合時,將語意保留而進行不同句型的替換。利用『同義中文結構樹關聯技術』所建立出來的同義結構樹進行替換
文字格式數位浮水印技術-句型替換演算法(續)同義中文結構樹轉51文字格式數位浮水印技術-浮水印encoding技術
發展一浮水印encoding技術,將欲植入的浮水印分解成小部分,分別植入選定的句子中,而即使知道加入的浮水印的encoding程序,未經授權者也無法移除所加入的浮水印。此浮水印encoding技術採用密鑰(encryptionkey)approach,只有在獲得密鑰(encryptionkey)以及encoding後的文章才可解析浮水印。文字格式數位浮水印技術-浮水印encoding技術發展一浮52文字格式數位浮水印技術-浮水印encoding技術(續)浮水印分解技術:將欲植入的浮水印分解成小部分,分別植入選定的句子結構樹之結構中。Unicode轉換
自然語言實驗室10000111010011101Unicode文字格式數位浮水印技術-浮水印encoding技術(續)浮水53文字格式數位浮水印技術-浮水印encoding技術(續)浮水印植入技術:將經過分解過後的浮水印資訊的每一小部分,分別Encoding到選定的句子樹狀結構中。WatermarkUnicode轉換10011…1Bit轉換Bit轉換Bit轉換句子1句子2句子n...EncryptionkeyEncryptionkeyEncryptionkey1010…0110…0010…MatchMatchMatchYesYesno成功成功句型替換文字格式數位浮水印技術-浮水印encoding技術(續)浮水54文字格式數位浮水印技術-浮水印encoding技術(續)浮水印解析技術:為浮水印植入技術的一個反向操作滿足就算知道Encoding的方式,只有拿到Encoding用的密鑰(encryptionkey)以及encoding後的文章才可解析浮水印
文字格式數位浮水印技術-浮水印encoding技術(續)浮水55QuadraticResidue
二次殘差(quadraticresidue)QuadraticResidue
56目前做法找一質數p,產生QuadraticResidueTable123456...IsQuadraticResidue?111101…QuadraticResidue:1QuadraticnonResidue:0目前做法找一質數p,產生QuadraticResidu57同義句型替換同義句型替換58目的維持一句子的語意,而將句子的結構(句型)進行替換(換句換說)。目的維持一句子的語意,而將句子的結構(句型)進行替換(換句換59同義句型替換-Zeroanaphoran≠m他買了一顆蘋果,很新鮮。他買了一顆蘋果,蘋果很新鮮。VPVHDfa很新鮮SVPVHDfa很新鮮NPNa蘋果S同義句型替換-Zeroanaphoran≠mVPVH60同義句型替換-CoReference代名詞以其所指涉之名詞替換張三是老師,他教學很認真。張三是老師,張三教學很認真。SVPDfa很VH認真NPNh他VA教學SVPDfa很VH認真NPNb張三VA教學同義句型替換-CoReference代名詞以其所指涉之名詞替61同義句型替換-CoReference(Con.)代名詞(名詞)以其所指涉之(名詞+屬性)替換張三是老師,同時,他也是一位好爸爸。張三是老師,同時,張三老師也是一位好爸爸。SNPNf位NPNh他Neu一D也SHI是NPNa爸爸VH好NPSNPNf位NPNb張三Neu一D也SHI是NPNa爸爸VH好NPNa老師同義句型替換-CoReference(Con.)代名詞(名62同義句型替換-以Grammar分析為基礎之同義句型替換分析中文Grammar以獲得各種同義句型替換規則。並列連接詞(Ca)關聯連接詞(Cb)…需有中文人才支援整理出各種Grammar轉換ruleRule如何套用在同義句型替換?寫死在程式中?發展一套用rule的adapter同義句型替換-以Grammar分析為基礎之同義句型替換分63並列連接詞(Ca)
並列連接詞連接兩個概念相似的成分,形成向心式結構,組成成分的作用與其連接成分相同。對等連接詞(Caa)並列連接詞(Ca)並列連接詞連接兩個概念相似的成分,形成向64關聯連接詞(Cb)
「一般關聯連接詞」存在有前後相對的連接詞(e.g.因為~所以~)。我因為生病了所以媽媽不給我出去玩我生病了所以媽媽不給我出去玩媽媽不給我出去玩是因為我生病了XY雖然可是因為所以縱然何況如果
那麼
温馨提示
- 1. 本站所有资源如无特殊说明,都需要本地电脑安装OFFICE2007和PDF阅读器。图纸软件为CAD,CAXA,PROE,UG,SolidWorks等.压缩文件请下载最新的WinRAR软件解压。
- 2. 本站的文档不包含任何第三方提供的附件图纸等,如果需要附件,请联系上传者。文件的所有权益归上传用户所有。
- 3. 本站RAR压缩包中若带图纸,网页内容里面会有图纸预览,若没有图纸预览就没有图纸。
- 4. 未经权益所有人同意不得将文件中的内容挪作商业或盈利用途。
- 5. 人人文库网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对用户上传分享的文档内容本身不做任何修改或编辑,并不能对任何下载内容负责。
- 6. 下载文件中如有侵权或不适当内容,请与我们联系,我们立即纠正。
- 7. 本站不保证下载资源的准确性、安全性和完整性, 同时也不承担用户因使用这些下载资源对自己和他人造成任何形式的伤害或损失。
最新文档
- 计算机软件测试的风险管理试题及答案
- 机电工程信息系统架构试题及答案
- 考试时间有效管理的建议试题及答案
- 安全带试题及答案
- 项目开发与维护策略试题及答案
- 软件设计师考试知识掌握要点试题及答案
- 公共政策中风险管理的重要性分析试题及答案
- 软考网络工程师重要考点试题及答案
- 英语四级上册四b试卷及答案
- 环境政策与可再生能源的互动试题及答案
- JT-T-1180.2-2018交通运输企业安全生产标准化建设基本规范第2部分:道路旅客运输企业
- 2024年遂宁市中考理科综合真题试卷(含答案解析)
- 2024年河北省中考道德与法治真题含解析
- 办公用品供应合同模板
- DLT 5285-2018 输变电工程架空导线(800mm以下)及地线液压压接工艺规程
- 军事训练夏令营合同样本
- 2024年国家保安员资格考试题库及参考答案(完整版)
- 2023-2024学年江苏省连云港市新海实验中学英语七年级第二学期期末达标检测试题含答案
- 2024年南昌市高三二模(第二次模拟测试)物理试卷(含答案)
- 基础有机化学实验智慧树知到期末考试答案2024年
- 项目攻关方案
评论
0/150
提交评论