`
andyliuxs
  • 浏览: 136446 次
  • 性别: Icon_minigender_1
  • 来自: 武汉
社区版块
存档分类
最新评论
文章列表
情感分析,我研究了也有半年有余了,ACL Anthology上关于情感分析的论文也基本看过了一遍,但是到目前还没有什么成就的。以下是我为一位同学毕业设计写的情感分析方面的综述,引用的论文 基本上是ACL和COLING还有EMNLP上历 ...
实时搜索引擎-tweetfeel.com ·网站名称:tweetfeel.com( http://www.tweetfeel.com/ ) ·上线时间:未知 ·所在地点:国外  推荐理由:这是一个提供实时搜索的引擎,目前主要应用于Twitter。对于实时搜索来说很容易理解,也就是在刚刚或几分钟内产生的信息,当然这种应用很适合像Twitter这种每天有大量实时信息的网站应用。 今天互联网拥有天文数字级别的信息,所以我们已不太担心缺少信息,而是如何去组织和发 ...
对程序员 们来说挑战自我非常重要,要么不断创新,要么技术停滞不前。新年伊始,我整理了12个月的目标,每个目标都是对技术或个人能力的挑战,而且可以年复一年循环使用。 01. 变得有耐心 02. 保持健康 03. 拥抱变化带来 ...
  Note: This is guide shows, howto install and keep up-to-date Adobe Reader (Acrobat PDF Reader) current version 9.4.2 with YUM on Fedora 16/15/14/13/12, CentOS 6/5.7, Red Hat (RHEL) 6.1/6/5.7. This method works both 32-bit and 64-bit architectures. This method also installs working ...
CentOS5,启动过程中出现以下问题: INIT:Id "x" respawning too fast,disabled for 5 minutes 图形界面无法启动。 首先根据错误信息知道是init程序在执行系统 启动脚本时出现问题,init所执行的脚本是 /etc/inittab, 查看之: [root@localhost ~]# cat /etc/inittab, 找到最后一行: x:5:respawn:/e ...
在winxp和linux双系统下卸载Linux系统,很多童靴会采用在windows系统中将linux分区直接格式化删除的方法,认为这能卸载掉 Linux系统。但是不幸的是将linux分区删除重启电脑会出现grub>这个符号,然后就无法进入windows或linux任何一个系统了。我刚开始学习Linux的时候也经常遇到这个问题,所以以后每次想卸载Linux系统的时候都会很小心的查找些相关资料再进行处理, 现在,想着把之前找的一些比较好的资料贴在这里,也为以后自己在处理这种情况的时候不用在去查资料了 。 Note : 本文中提到的部分工具可以直接在后面的附件中下载得 ...
如果你曾经用过Perl或任何其他内建正则表达式支持的语言,你一定知道用正则表达式处理文本和匹配模式是多么简单。如果你不熟悉这个术语,那么“正则表达式”(Regular Expression)就是一个字符构成的串,它定义了一个用来搜索匹配字符串的模式。 许多语言,包括Perl、PHP、Python、JavaScript和JScript,都支持用正则表达式处理文本, 一些文本编辑器用正则表达式实现高级“搜索-替换”功能。那么Java又怎样呢?本文写作时,一个包含了用正则表达式进行文本处理的Java规范需求 (Specification Request)已经得到认可,你可以期待在JDK的 ...
以前提到过SVN版本控制器和客户端的安装和配置,这里再在说一下在编译器中怎么使用SVN,使其既可以单独使用,也可以配合SVN客户端一起使用。由于编译器种 类众多,插件种类也不同,这里只简单介绍下Eclipse的插件安装。我用的版本是Eclipse3.2.2+MyEclipse_5.1.1,由于本身 只有CVS而没有集成SVN,所以要想使用SVN做版本控制只好装一个Eclipse插件Subclipse,Subclipse的详细安装过程在其官方 网站 http://subversion.tigris.org写的很清楚,还带配图,我就直 ...
本人今天忙了一整天,终于把JSP的开发环境配置完成了,在配置过程中遇到不少问题,现在记录以下我的配置过程:   开发环境:   JDK:j2sdk 6.0-windows-i586.exe   下载地址:java.sun.com/javase/downloads/index.jsp             Tomcat:apache-tomcat-6.0.14.exe   下载地址:tomcat.apache.org/download-60.cgi              Eclipse:eclipse-SDK-3.3-win32.zip     下载地址:www.e ...
Eclipse的开发能力本身很有限,但是它支持强大的插件功能,这使得这个免费开源的IDE倍受青睐。Eclipse的插件安装分为两种方式: 1.在线安装 在线安装十分简单,但是需要有较好的网络做支持。 点击“Help”菜单,然后将光标移动到“Software Updates”菜单项上,然后单击“Software Updates”菜单项上的“Find and Install”子菜单,如图   将弹出对话框,该对话框用来选择升级已装插件或下载安装新插件。上面的用于升级新插件,下面的用于下载安装新插件。如果需要升级已装插件,选择第一个点击“Finish”按钮即可。如果需要安装新插件,选 ...
         Heritrix是一个纯Java开发的、开源的Web网络爬虫,开发者可以可以根据自己的抓取逻辑来对它的各个组件进行扩展,但是在扩展之前必须对其各个组件有个整体的理解。下面的图示,是我在学习Heritrix时对整体各个组件间的关系的理解,仅供大家参考,自己能力有限,不对的地方大家一起探讨下。  
最近在看邱哲等人编著的《开发自己的搜索引擎Lucene+Heritrix》一书,里面有一章专门讲Hertrix的配置问题的,可是感觉讲得很麻烦,其实很简单。故将自己的配置方法整理下: 由于Hertrix的是开源的网络爬虫工具,具有很强的可扩展性,开发者可以根据自己的抓取逻辑对其源码进行修改。但是如果你仅是想利用Hertrix进行网页的抓取,那么配置就更简单了。只需下载到SourceForge网站上下载Heritrix的jar包就ok了,但是如果你还想对其源码进行修改来研究Heritrix的实现那可以下载源代码包。 1、无需修改源码的配置方法     1)解压下载到的heritrix-1.1 ...

博客推荐

      各位朋友,大家在浏览技术博客的目的无非是学习,但每个人的精力总是有限的,往往在无意之间发现一些别人可能没有发现的优秀博客,那么将这些博客推荐给你的朋友,大家一起学习,分享。同样,别人也会将他们发现的优秀博客推荐给你,这无意是一个双赢的学习交流方式。      现在我先推荐下我看到的几个优秀的博客,希望大家也能将你们感觉很好的博客推荐出来,大家一起学习: 喜欢算法的朋友可以看下csdn论坛上的July的博客http://blog.csdn.net/v_JULY_v,你也可以在Google或百度上输入“结构之法”进行搜索。该博主发布了大量的优秀的有关算法、程序员面试等方面的博文, ...
1、int ICTCLAS_ImportUserDictFile(byte[] sPath, int eCodeType)接口:      * Method:     ICTCLAS_ImportUserDictFile<! 导入用户词典文件>     * Parameter:  byte[] sPath<! 用户词典路径名称>     * Parameter:  int eCodeType<!词典编码类型>     * Returns:      ICTCLAS_API int<! 成功导入的词汇数量>     * Description: 用 ...
boolean ICTCLAS_FileProcess(byte[] sSrcFilename, int eCodeType, int bPOSTagged, byte[]sDestFilename)接口:该接口与ICTCLAS_ParagraphProcess接口类似,只是该接口用与处理文件,对整个文件的内容进行分词并标注,最后将结果存在目标文件中  * Method:     ICTCLAS_FileProcess<!文本文件分词> * Parameter:  byte[] sSrcFilename<!要分词的文件> * Parameter: int eCodeTy ...
Global site tag (gtag.js) - Google Analytics