您好,欢迎来到包装印刷网!

当前位置: 首页 > 新闻资讯  > 新闻资讯 > 行业资讯

清华大学多体蒙古文印刷文档识别平台通过鉴定

2018/6/24 23:07:25 人评论

近日,由清华大学承担的多体蒙古文(混排汉英)印刷文档识别暨统一平台少数民族文字识别系统通过了教育部科技发展中心组织的鉴定。

  在教育部、国家语委、国家自然科学基金委的支持下,清华大学与内蒙古大学、内蒙古师范大学协作研究开发成功了多体蒙古文(混排汉英)印刷文档识别系统,并结合清华大学已研制成功的的藏维文等文档识别研究成果,在世界上首次推出了统一平台上蒙古文、藏文、维吾尔文、哈萨克文、柯尔克孜文及朝鲜文(混排汉英)印刷文档识别系统。在多体蒙古文(混排汉英)印刷文档识别系统研究方面,根据蒙古文的实际特点和难点,采用基于字素的文本切分识别方案。

  主要技术特点如下:

  1.提出了一种基于统计鉴别分析的多字体多字号蒙古文字符识别的方法,对蒙古文的常见多种字体(白体、黑体、报体、哈旺体/楷体等二十余种字体)具有良好适应性,单字测试平均识别率达99%以上;

  2.提出并实现多字体蒙古文文本切分方法,在提取单词基线位置后,通过定义代价函数,综合分析字符几何位置、形状等多种信息,取代价函数极小值处作为切分点;提出了蒙汉英语种判别方法,结合汉、英文识别技术,实现蒙汉英混排文本识别。文本识别率可达96.8 %以上。

  3.具有蒙古文印刷文档版面分析方法,可分析处理文本、图片、表格区域。

  4. 研制字符形码到Unicode标准蒙古文编码转换方法。

相关资讯

  • 没有油墨也可印刷 这是怎么回事

    无论何种印刷方式都离不开油墨,这已经成为人们的固有观念,而无墨印刷技术无疑将打破这一观念,如果真能够实现,这必将成为一种新型的印刷技术。业界曾经出现过有关无墨印刷技术的介绍,笔者最近在查阅专利的过程中,又发现了有关“无墨印刷设备”的专利,因此对其产生了…

    2025/7/13 8:36:17
  • 玻璃印刷中 丝网印刷和UV印刷工艺特点对比

    在玻璃行业,在玻璃上印图案有两种方法,一种是丝网印刷,一种是UV印刷。玻璃丝印是按客户的图纸制作网版,印刷时通过刮板的挤压,使油墨通过图文部分的网孔转移到玻璃上,形成与原稿一样的,网版是用电脑绘制的图案打印成菲林、然后使用菲林和感光胶等制作而成。图案和文…

    2025/6/18 8:03:36
  • 2025年1—3月份印刷和记录媒介复制业利润下降5.4%

    4月27日,国家统计局发布2025年1—3月份全国规模以上工业企业利润情况。1—3月份,全国规模以上工业企业实现利润总额15093.6亿元,同比增长0.8%(按可比口径计算)。  1—3月份,规模以上工业企业中,国有控股企业实现利润总额5599.5亿元,同比下降1.4%;股份制企业实现…

    2025/5/17 8:32:51
  • OLED面板可以印刷出来 巨头们纷纷点赞

    最新的消息:LG和三星要在2017年投入建设“印刷OLED”面板示范线。如果这一计划落实,这将是OLED向大规模普及迈出的关键一步……  但是,等一等!为什么又出来了一个叫做“印刷OLED”的新东西呢?这是一种新的显示技术吗?过去5年,OLED“就要来了”的宣言已经听得耳朵…

    2025/5/14 8:03:38

共有 网友评论