这篇文章记录了,在Ubuntu 14.04服务器上更新Git遇到的问题,Git源更新,安装更新源的命令:apt-add-repository。
(更多…)
分类: 技术宅
-
安装、更新最新的Git – Ubuntu环境
-
法语论文中法文自动对齐
我的中法文自动对齐的论文
Kun JIN (2013) Alignement automatique des corpus bilingue français et chinois
-
什么是知识库,和其他数据库的区别?
知识库(Knowledge Base,简称“KB”)是一个通过计算机系统来存储复杂结构和非结构化信息的技术。该词最早出现在专家系统中,称为知识库系统。
知识库系统以知识库为基础的,该知识库包括了现实世界中的事实,同时一个推理引擎可以推理出这些事实,也可以使用一些规则或者其他逻辑演绎出新的事实或指出不符的事实。
-
RDF效率 的评测 – 翻阅资料
“RDF效率” 的问题,是在建立“知识库”(或者“语义网”)所遇到的一个主要问题,RDF的存储系统在市面上有很多,Jena, Virtuoso, Sesame, BigData, BigOWLIM等开源系统,AllegroGraph,Marklogic等商业系统,大公司Oracle的Spatial and Graph也开始支持RDF的查询。这么多的框架该如何选择,哪个系统最适合手头的项目,这变成了一个重要的问题。该文整理了查阅工作的一些资料和心得,免得以后做重复的工作。
-
造就数据科学家(转)
结合自身的经历,从NLP开始,到在研究所做数据的TEI结构设计,再在欧盟DARIAH上介绍这个结构,以及目前手头在做的语义网,无一不是在和数据、结构打交道,始终困惑这应该属于什么类型的职位,看到这篇文章实在是帮我找到了一个位置,希望有相同困扰的朋友也看看。
-
齐夫定律 – Zipf’s law
齐夫定律(英语:Zipf’s law,IPA英语发音:/ˈzɪf/)是由哈佛大学的语言学家乔治·金斯利·齐夫(George Kingsley Zipf)于1949年发表的实验定律。它可以表述为:在自然语言的语料库里,一个单词出现的频率与它在频率表里的排名成反比。所以,频率最高的单词出现的频率大约是出现频率第二位的单词的2倍,而出现频率第二位的单词则是出现频率第四位的单词的2倍。这个定律被作为任何与幂定律概率分布有关的事物的参考。 (更多…)
-
UOITEMASSIST (ULTIMA ONLINE 物品管理助手)V1.5更新
UOItemAssist目前已经1.5版本啦,上一周小更新有很多,目前版本比较完善,因此放出这个版本,请见1.2-1.5版本的更新内容:
百度网盘:http://pan.baidu.com/s/1ntwVtzz
SourceForge: https://sourceforge.net/projects/uoitemassist/三分钟的使用说明视频 (Manuel in video 3 mins):
优酷 : http://v.youku.com/v_show/id_XODM5MzkwODYw.html
Youtube : https://www.youtube.com/watch?v=9KbO6xLvtoM -
UOITEMASSIST (ULTIMA ONLINE 物品管理助手)V1.1
UOItemAssist是为了方便的管理和查看Ultima Online(以下简称UO, 网络创世纪)的物品所开发的程序。主要功能:按条件筛选、物品分级、拖出、整理等等。
-
The Text Encoding Initiative简介
The Text Encoding Initiative (简称:TEI)是由来自世界各的学术机构、科研项目及学者组成的一个非营利性会员制组织,主要开发和维护一套文本数字化编码标准(Guidelines)。该标准是一套机器可读的文本编码,主要使用在人文科学,社会科学和语言学。 自1994年以来,TEI Guidelines已广泛被图书馆,博物馆,出版商和学者应用于文本的在线研究,教学和资料的保存的工作之中。除了这套Guidelines,该协会还提供了的多种资源和培训活动用以TEI的学习、TEI的项目开发、TEI出版物的发表及适应TEI的程序开发。
TEI协会用了很大篇幅解释了TEI和Guideline的区别,其实业界常常以TEI来表示文本编码格式,因此,我们可以听到”如何将一个XHTML文本转换为TEI格式?”这样的问题。之后的文章中如果不着重说明“TEI协会”,基本都指TEI编码格式。
对于想学TEI 的大家,也许怎么开始是一个小小的挑战,下面的网址提供了关于TEI的一些信息,包括TEI Guidelines的概况、XML和文本标签的基本概念、TEI系统中schemas(也称“ODD”)的写入和档案化的指导。英文好的朋友可以直接进入下面网址开始学习TEI。
http://www.tei-c.org/Support/Learn/index.xml
另外也推荐由谢筱琳、黄韦宁翻译的《TEI使用指南:运用TEI处理中文文献》(繁体版),以下是链接:
http://www.tei-c.org/Support/Learn/TEI-ChinLoc-2ndPrintEd.pdf
简单的自我介绍一下,自2013年起,我加入TEI-CMC小组,主要负责网络通信文本的法语语料库的建模及归档处理,这项工作属于TEI的扩展,以下是我们小组的WIKI:
http://wiki.tei-c.org/index.php/SIG:Computer-Mediated_Communication
-
UOItemAssist (Ultima Online 物品管理助手)v1.0
UOItemAssist是为了方便的管理和查看Ultima Online(以下简称UO, 网络创世纪)的物品所开发的程序。主要功能:按条件筛选、物品分级、拖出、整理等等。