




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1、面向?qū)@墨I的機器翻譯系統(tǒng)定制面向?qū)@墨I的機器翻譯系統(tǒng)定制Siriussoft Corp.目錄I.公司簡介II.技術(shù)競爭力III.韓國專利文獻的特點IV.定制過程V.改良需求2008-11-04公司簡介 Siriussoft 目前擁有韓譯英、英譯韓、韓譯日以及日譯韓的機器翻譯技術(shù)。 公司計劃擴展機器翻譯所涵蓋語種,如漢譯韓、德譯英、法譯英以及俄譯英。3現(xiàn)行經(jīng)營模式現(xiàn)行經(jīng)營模式 產(chǎn)品 : 集成有機器翻譯引擎的 在線專利檢索系統(tǒng) 韓國專利 (K2E-PAT) EP, US, JP, PCT 專利 (E2K)平臺: KIPRIS 網(wǎng)站 (eng.kipris.or.kr) PIE 網(wǎng)站 ()目標客
2、戶: 終端用戶 一千四百萬 KIRRIS 用戶 研究人員、信息專家 個人發(fā)明者、專利律師等價格 : $ 30 /篇 (K2E) 篇幅不限公司簡介終端用戶終端用戶研究人員研究人員個人發(fā)明者個人發(fā)明者專利律師專利律師信息專家信息專家公司簡介 歷史與成就2/16/20222008.09 E2K 機器翻譯引擎嵌入KIPO內(nèi)部專利檢索系統(tǒng)2008.07 在KIPRIS 網(wǎng)站開通E2K & J2K 服務2007.11 開通 PIE.COM 服務: 2007.04 為三邊專利局開通K2E機器翻譯系統(tǒng)2006.12 J2K機器翻譯引擎并入KIPO 內(nèi)部專利檢索系統(tǒng)2006.10 KIPRIS系統(tǒng)開通 K2E-
3、PAT服務2005.11 開通 K-PION (韓國專利信息在線網(wǎng)絡(luò)系統(tǒng)) 2004.12 獲得ETRI機器翻譯技術(shù)轉(zhuǎn)讓5機器翻譯:計算語言學的分支學科,研究如何運用計算機軟件將文本或語音從一種自然語言翻譯為另一種自然語言 。語素處理技術(shù)句法處理技術(shù)語義處理技術(shù)語境處理技術(shù)句子生成技術(shù)技術(shù)競爭力源語句語素分析器 句法分析器 詞典知識庫語境處理語法庫生成器目標語句分析語法技術(shù)競爭力 專利領(lǐng)域?qū)S肕T系統(tǒng)詞典和語法的涵蓋范圍限制在專利領(lǐng)域文章,使輸出譯文具有高準確度。 K2E 專利機器翻譯系統(tǒng) K2J 專利機器翻譯系統(tǒng) E2K 專利機器翻譯系統(tǒng) J2K 專利機器翻譯系統(tǒng) MT 方法 K - E 引
4、擎 : 以“基于模板”為主的機器翻譯 K J 引擎 : 基于規(guī)則的機器翻譯將來會用到混合方法目標文本基于規(guī)則基于模板基于統(tǒng)計詞法分析源文本混合機器翻譯系統(tǒng)混合機器翻譯系統(tǒng)技術(shù)競爭力 專利技術(shù) (ETRI)多語言翻譯設(shè)備中用于識別多語言短語的系統(tǒng)(KR0261273) 基于概念的跨國語言翻譯系統(tǒng)的自動語法修正方法(KR0204068 ) 對大量機器翻譯請求的快速響應翻譯記憶例) Opposition to Utility Model Registration例) The due date of submission of the amendment for the present applica
5、tion is not allowed until the above due date.對同一個機器翻譯請求進行分布式計算 負載平衡技術(shù) 多樣與便捷的 API網(wǎng)絡(luò)翻譯, 批量翻譯, 電子文件翻譯等 語序差異英語是SVO語言,而韓語是SOV語言 格標記英語中不存在格標記沒有對應于“, ”的英文詞 冠詞韓語中不存在冠詞通常不被翻譯成特定的詞韓國專利文獻的特點 HeHe ateate thethe cookcookiesiesS O VS O VS V OS V O韓國專利文獻的特點 間隔單位不同英語 詞與語素相對應 不需要改變間隔單位韓語 詞(eojeol)與語素不同 需要改變間隔單位 * Eo
6、jeol是人性化的間隔單位 主語韓語語句中,主語可以省略英語語句的主語不能被對應到一個韓語詞匯韓國專利文獻的特點 專利文獻極長又復雜的句子 韓語專利文獻中,句子由平均14.5個Eojeol組成 韓語新聞文章中,句子由平均12.3個Eojeol組成獨特的句型 摘要例) 本發(fā)明涉及 發(fā)明內(nèi)容詳述例)根據(jù)現(xiàn)有技術(shù) 如圖N所示 附圖簡要說明例) 圖n是用于說明的視圖 有益效果例) 本發(fā)明的有益效果在于 權(quán)利要求例)如權(quán)利要求n所述的,進一步包括 11定制過程 半自動詞典創(chuàng)建過程通過包含在專利文獻中的括號提取韓英語對雙語專利標題語料庫雙語專利標題12(TFT : (TFT : ThineThine Fi
7、lm Transistor) Film Transistor)(patterning)(patterning)(etching)(etching)(deposition)(deposition)定制過程 手動詞典創(chuàng)建過程日常處理 機器翻譯過程中未得到翻譯的詞匯被自動報告給翻譯人員 年度處理 術(shù)語從一年中的韓語專利文獻中抽取 新術(shù)語自動識別 新術(shù)語人工翻譯 加入到字典13定制過程 名字翻譯過程 包含在PCT等同專利、申請代碼、公司網(wǎng)站及羅馬字體書寫規(guī)則中的英文名 14定制過程 語句模板創(chuàng)建過程手工創(chuàng)建專利特有語句模板例1) 源文本: KR 模板 : NP1 匹配模板: NP1 that be:v
8、 achieved by the present invention 目標文本: The system that is achieved by the present invention is developed.例2) 源文本: KR 模板: NP1 NP2 VP1 匹配模板: NP1TopicVP1 compared to NP2 目標文本: The Invention improved performance compared to the prior art.15定制過程 消除詞語歧義DB建設(shè): IPC的統(tǒng)計信息例) 韓語詞“” 可以被翻譯成 電子領(lǐng)域中的“磁極” 醫(yī)藥領(lǐng)域中的“刺激” 16改良需求 源語句自身的錯誤 間隔錯誤 例) (synchronization plan) + (east evapor
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- DB32/T 3575-2019快速貨運服務規(guī)范
- DB32/T 3529-2019桂花白葉茶加工技術(shù)規(guī)程
- DB31/T 954-2015犬瘟熱病毒和犬細小病毒熒光PCR檢測方法
- DB31/T 945.2-2015節(jié)能服務業(yè)服務規(guī)范第2部分:合同能源管理
- DB31/T 586-2012甜菜夜蛾測報技術(shù)規(guī)范
- DB31/T 397-2021醫(yī)源性織物清洗消毒衛(wèi)生要求
- DB31/T 1280-2021實驗裸鼴鼠環(huán)境及設(shè)施
- DB31/ 927-2015黑色金屬可控氣氛熱處理工序單位產(chǎn)品能源消耗限額
- CMMA/T 1-2015鎂質(zhì)膠凝材料制品用硫酸鎂
- CAB 1015-2012汽車座墊
- 湖北省黃岡市(2024年-2025年小學三年級語文)人教版隨堂測試(下學期)試卷(含答案)
- 中醫(yī)護理學 課件 模塊七 中醫(yī)護理操作 項目九中藥熏洗技術(shù)
- 2021MAM-6070M空壓機微電腦控制器
- 2024年全國高考新課標卷物理真題(含答案)
- 四川省瀘州市2024年中考物理試題(含答案)
- J∕T∕T 1039-2016 公路橋梁聚氨酯填充式伸縮裝置
- 工學云周報范文200字
- 山東省濟南市高新區(qū)2023-2024學年八年級下學期期末物理試題
- 2022-2023學年廣東省廣州市荔灣區(qū)教科版(廣州)四年級下冊期末綜合練習英語試卷(無答案)
- DLT 5285-2018 輸變電工程架空導線(800mm以下)及地線液壓壓接工藝規(guī)程
- 蛛網(wǎng)膜下腔出血及動脈瘤影像表現(xiàn)
評論
0/150
提交評論