齐夫定律 – Zipf’s law

齐夫定律(英语:Zipf’s law,IPA英语发音:/ˈzɪf/)是由哈佛大学的语言学家乔治·金斯利·齐夫(George Kingsley Zipf)于1949年发表的实验定律。它可以表述为:在自然语言的语料库里,一个单词出现的频率与它在频率表里的排名成反比。

齐夫定律(英语:Zipf’s law,IPA英语发音:/ˈzɪf/)是由哈佛大学的语言学家乔治·金斯利·齐夫(George Kingsley Zipf)于1949年发表的实验定律。它可以表述为:在自然语言的语料库里,一个单词出现的频率与它在频率表里的排名成反比。所以,频率最高的单词出现的频率大约是出现频率第二位的单词的2倍,而出现频率第二位的单词则是出现频率第四位的单词的2倍。这个定律被作为任何与幂定律概率分布有关的事物的参考。 Continue reading “齐夫定律 – Zipf’s law”

UOITEMASSIST (ULTIMA ONLINE 物品管理助手)V1.5更新

UOItemAssist目前已经1.5版本啦,上一周小更新有很多,目前版本比较完善,因此放出这个版本,请见1.2-1.5版本的更新内容

UOItemAssist目前已经1.5版本啦,上一周小更新有很多,目前版本比较完善,因此放出这个版本,请见1.2-1.5版本的更新内容:

百度网盘:http://pan.baidu.com/s/1ntwVtzz
SourceForge: https://sourceforge.net/projects/uoitemassist/

三分钟的使用说明视频 (Manuel in video 3 mins):

优酷 : http://v.youku.com/v_show/id_XODM5MzkwODYw.html
Youtube : https://www.youtube.com/watch?v=9KbO6xLvtoM

Continue reading “UOITEMASSIST (ULTIMA ONLINE 物品管理助手)V1.5更新”

UOITEMASSIST (ULTIMA ONLINE 物品管理助手)V1.1

UOItemAssist是为了方便的管理和查看Ultima Online(以下简称UO, 网络创世纪)的物品所开发的程序。主要功能:按条件筛选、物品分级、拖出、整理等等。

UOItemAssist是为了方便的管理和查看Ultima Online(以下简称UO, 网络创世纪)的物品所开发的程序。主要功能:按条件筛选、物品分级、拖出、整理等等。

steamworkshop_collection_1397670961_collection_branding Continue reading “UOITEMASSIST (ULTIMA ONLINE 物品管理助手)V1.1”

The Text Encoding Initiative简介

The Text Encoding Initiative (简称:TEI)是由来自世界各的学术机构、科研项目及学者组成的一个非营利性会员制组织,主要开发和维护一套文本数字化编码标准(Guidelines)。该标准是一套机器可读的文本编码,主要使用在人文科学,社会科学和语言学。

The Text Encoding Initiative (简称:TEI)是由来自世界各的学术机构、科研项目及学者组成的一个非营利性会员制组织,主要开发和维护一套文本数字化编码标准(Guidelines)。该标准是一套机器可读的文本编码,主要使用在人文科学,社会科学和语言学。 自1994年以来,TEI Guidelines已广泛被图书馆,博物馆,出版商和学者应用于文本的在线研究,教学和资料的保存的工作之中。除了这套Guidelines,该协会还提供了的多种资源和培训活动用以TEI的学习、TEI的项目开发、TEI出版物的发表及适应TEI的程序开发。

TEI协会用了很大篇幅解释了TEI和Guideline的区别,其实业界常常以TEI来表示文本编码格式,因此,我们可以听到”如何将一个XHTML文本转换为TEI格式?”这样的问题。之后的文章中如果不着重说明“TEI协会”,基本都指TEI编码格式。

对于想学TEI 的大家,也许怎么开始是一个小小的挑战,下面的网址提供了关于TEI的一些信息,包括TEI Guidelines的概况、XML和文本标签的基本概念、TEI系统中schemas(也称“ODD”)的写入和档案化的指导。英文好的朋友可以直接进入下面网址开始学习TEI。

http://www.tei-c.org/Support/Learn/index.xml

另外也推荐由谢筱琳、黄韦宁翻译的《TEI使用指南:运用TEI处理中文文献》(繁体版),以下是链接:

http://www.tei-c.org/Support/Learn/TEI-ChinLoc-2ndPrintEd.pdf

简单的自我介绍一下,自2013年起,我加入TEI-CMC小组,主要负责网络通信文本的法语语料库的建模及归档处理,这项工作属于TEI的扩展,以下是我们小组的WIKI:

http://wiki.tei-c.org/index.php/SIG:Computer-Mediated_Communication

UOItemAssist (Ultima Online 物品管理助手)v1.0

UOItemAssist是为了方便的管理和查看Ultima Online(以下简称UO, 网络创世纪)的物品所开发的程序。主要功能:按条件筛选、物品分级、拖出、整理等等。

UOItemAssist是为了方便的管理和查看Ultima Online(以下简称UO, 网络创世纪)的物品所开发的程序。主要功能:按条件筛选、物品分级、拖出、整理等等。

steamworkshop_collection_1397670961_collection_branding Continue reading “UOItemAssist (Ultima Online 物品管理助手)v1.0”

UOItemAssist – UO物品管理工具 v0.8

UOItemAssist是为了方便的管理和查看Ultima Online(以下简称UO, 网络创世纪)的物品所开发的程序。

UOItemAssist是为了方便的管理和查看Ultima Online(以下简称UO, 网络创世纪)的物品所开发的程序。

steamworkshop_collection_1397670961_collection_branding
Continue reading “UOItemAssist – UO物品管理工具 v0.8”

隐藏QListWidgetItem的checkbox

本文主要介绍Python下通过设置Qt::CheckStateRole来隐藏勾选框(checkbox)的方式,
QListWidgetItem设置物品多选的的方法很简单,通过setCheckState()或者setFlags()都可以实现,但是在设置“多选”之后,勾选框就不能通过设置setFlags()来去除Qt::ItemIsUserCheckable的标识。

本文主要介绍Python下通过设置Qt::CheckStateRole来隐藏勾选框(checkbox)的方式。

QListWidgetItem设置物品多选的的方法很简单,通过setCheckState()或者setFlags()都可以实现,但是在设置“多选”之后,勾选框就不能通过设置setFlags()来去除Qt::ItemIsUserCheckable的标识。

根据以下链接的博文说明:
http://badlyhonedbytes.wordpress.com/2013/03/31/hiding-the-checkbox-of-a-qlistwidgetitem/

The trick is to use QListWidgetItem::setData() to set the data in the Qt::CheckStateRole to an empty QVariant(). The same method can be used to set the item’s check state.

只要通过QListWidgetItem::setData()来设置data中的Qt::CheckStateRole为一个空的变量QVariant()即可,在Python中实现方式如下:

from PyQt4 import QtCore, QtGui

#列出QlistWidget的总行数
rows = self.listWidget_item.count()

#读取QlistWidget中的每一行
for row in  xrange(rows):
    #返回所给“行”的物件
    item = self.listWidget_item.item(row)
    #设置Qt::CheckStateRole的值为空
    #的QVariant()变量,10代表Qt::CheckStateRole
    item.setData(10,  QtCore.QVariant())

参考资料
QListWidgetItem
http://qt-project.org/doc/qt-4.8/qlistwidgetitem.html
QVariant
http://qt-project.org/doc/qt-4.8/qvariant.html#QVariant
ItemDataRole
http://qt-project.org/doc/qt-4.8/qt.html#ItemDataRole-enum

Python描述符(descriptor)解密,文章地址

这篇文章解决了困扰我许久的疑问,实在太好了,网上所有的乱七八糟的说明,还不如这个来的完善,直接将文章链接放在最上面。

原文链接: Chris Beaumont 翻译: 极客范 慕容老匹夫
译文链接: http://www.geekfan.net/7862/

add another MS-Office spelling checker language

How to install a new language spelling checker in Office

when we install a language MS-Office, we have a language spelling checker by default, but if we  want use another language spelling checker, we must install an language package.

So here, a simple method in MS-Office 2010 which need a french spelling checker:

  1. check your office  2010 version, 32bits or 64bits?
  2. download the corresponding language package by below link:
    1. 32bits: http://www.microsoft.com/fr-fr/download/details.aspx?id=26616
    2. 64bits: http://www.microsoft.com/fr-fr/download/details.aspx?id=26619
  3. install language package.
  4. select in MS-Office language spelling checker (important)

for other language or MS-Office version: use your Google search by taping: “MS-Office 2013 french language package”, i’m sure you could find easily the best result.

[Fr|法文]维基百科讨论页面的处理手册

《维基百科讨论页面的处理手册》是从《CoMeRe》的项目《Wikiconflits》整理出来的一份操作手册,它介绍了为何分析,如何从维基百科的DUMP中提取相关页面,并如何分析页面中的Wikitext(维基文本),最后转换成项目要求的最终TEI格式。目前版本V2.0, 在1.0版本上添加了转换TEI的内容。本手册语言为法文。

手册法文介绍:
“Wikiconflits, un corpus extrait de Wikipédia : principe et méthode d’élaboration”, Le groupe CoMeRe-nouvelles-acquisitions-Wikipédia vise à constituer un corpus de pages Wikipédia qui sera adjoint au corpus CoMeRe afin d’améliorer sa représentativité. Son choix s’est porté autour de l’observation de pages ayant suscité des discussions conflictuelles autour de controverses dans les champs des sciences et des techniques. Dans une première partie, le groupe explique sa méthode de sélection des discussions conflictuelles. Dans les parties suivantes, le groupe CoMeRe-LRL expose la méthode de constitution du corpus en fonction des critères précédemment retenus et la façon de les transformer en TEI. Ce rapport se termine par la présentation de l’outil WikiTool développé lors des traitements. Mis à disposition sous licence libre il permet d’extraire des pages dans les fichiers de type Dump de Wikipedia.

CoMeRe网站(法文) http://comere.org/
下载: cmr-wikiconflits-tei-v2-manuel