首页 | 关于udndata  
关于udndata

  缘起
      联合知识库为联合线上公司于2000年4月筹备,2001年2月19日正式成立的新媒体。联合报系所发行的联合报、经济日报、民生报(民生报资料至2006/11/30止)、联合晚报及星报(星报资料至2006/10/31止)等五大报在过去五十年来共发行了一百卅万个报纸版面、一千多万则新闻、七十余亿个字。这些新闻资产正是台湾民众过去五十年生活的共同记忆,它不止是文字资料,而是历史的轨迹与验证。

    如何将这些重要的社会资产与全体华文社会共享,一直是联合报系长期以来认真思考的议题,当互联网普及后藉由数码化的科技,这个理想得以实现。联合知识库的成立不仅提供了新闻资料的检索更衍生了数码典藏历史的社会责任,活化报系五十年的新闻资料,完整而详实地呈现台湾近代珍贵史料,累积社会事实,传递文化变迁的轨迹,成为新世纪知识的库藏中心,并提供完善的知识管理工具,落实打造知识社会的基础工程。

   
  报纸数码化工程
 

    当联合报系政策决定执行报系五十年来报纸数码化的跨世纪工程时,首先面临的问题是五十年来报纸的纸质、照排、印刷历经多次技术革新,且拥有非常庞大的资料量,目前市场上并没有单一自动化的技术可以满足报系数位化工程的需求。联合知识库整合了多种技术开发出高效率的资料回溯系统,首先委托毅欣公司进行整版扫瞄,再将字体、字型变化较多,计算机不易辨识的标题用人工输入,接著以图文切割的方式将报纸版面上的内容分区切块透过全景软件公司为联合知识库打造的多核心光学影像辨识系统(OCR)将影像档转换为文字档储存,在此阶段文字的正确率已可达到百分之九十八以上,为了提高正确率全景公司还提供集字校对与逐字校对工具,透过两次「半人工、半自动」的循环校对后正确率提高到百分之九十九点九一。此项庞大的数码化工程除了藉助以上各技术来源外,并由联合报系印务部及校对中心同仁支持完成。

    联合知识库目前提供联合报系包括已回溯完成联、经、晚三报;及民(民生报资料至2006/11/30止)、星(星报资料至2006/10/31止)、Upaper等六报共千万余则新闻资料。

   
  影像图片储存
 

    在多媒体发达的时代,计算机的储存、存储器设备,已趋向便宜普及化,使用者的信息需求也由单纯的文字,进而发展至更精致的图片,联合知识库除了致力于文字资料的回溯之外,也于2004年2月推出影像图库的服务,由多位专业的编辑将报系珍贵的照片资料数码化,重新整理分类,提供使用者更多的信息。未来,影像图库的目标则是将联合报系五十年来的珍贵史料照片,以人工扫描重新整理的方式将之数码化,用图象的方式更具体呈现出台湾社会、历史人物的原貌。

    新闻图库目前拥有自1990年1月至今的联合报、经济日报、民生报(民生报资料至2006/11/30止)、联合晚报、星报(星报资料至2006/10/31止),所有数码化新闻图片资料,共计收藏450万余张,每张照片都有高画素,并已取得授权,可作为刊物印刷、网站素材及个人收藏。专题「档案照片」 则精选自1951年至1970年之数码化新闻照片,约1万余张,正持续新增当中。

     
关于我们 | 图文转载授权 | 营销业务| 著作权声明 | 隐私权声明 | udndata介绍 | 客服