海归网首页
海归宣言
导航
博客
广告位价格
会员列表
收 藏 夹
论坛帮助
登录
|
登录并检查站内短信
|
个人设置
论坛首页
|
排行榜
|
在线私聊
|
专题
|
版规
|
搜索
|
RSS
|
注册
|
活动日历
主题:
再来篇搜索的,兼回小周。中文搜索的分词技术 演示
海归论坛首页
->
海归商务
焦点讨论
|
精华区
|
嘉宾沙龙
|
白领丽人沙龙
分屏
表形显示
阅读上一个主题
::
阅读下一个主题
作者
再来篇搜索的,兼回小周。中文搜索的分词技术 演示
所跟贴
请教:中文分词需要字典,语法分析怎么搞呢?没头绪耶!
--
neo
- (0 Byte) 2005-8-19 周五, 04:07
(317 reads)
对门子
[
博客
]
[
个人文集
]
游客
标题:
这是最麻烦的。 关键是中文没有语法。
(308 reads)
时间:
2005-8-19 周五, 04:20
请教不敢当。 我也没想清楚, 所以还不敢全身心扑上去。
相关主题
QQ群号14889316:欢迎以下专业人士一起来探讨分词技术,搜索引擎技术...
海归论坛
2005-8-19 周五, 11:36
另外,急求搜索引擎技术人员的帮助,分词技术,SPIDER技术等朋友,请加我MSN
创业论坛
2005-8-18 周四, 23:01
大家都是扯谈,凭什么容许你扯,不让别人扯。看不惯可以不理,兼听则明。
海归主坛
2008-5-13 周二, 12:54
乾坤草:体用之辩,兼回东海(一枭附言)
海归茶馆
2008-3-08 周六, 12:28
《动物的文明》和稀泥,兼回明子矩ID
海归茶馆
2007-7-07 周六, 08:52
为遏制滥用智慧名称,国际中华智慧学会发布“信息技术领域智慧名词使用规范”
创业园区
2013-3-30 周六, 11:53
[波儿的小波]绿妖系列下架,下回分解。
春秋茶馆
2010-10-09 周六, 14:47
请教一下熟悉电力驱动的同学,大功率双电机驱动有什么好技术解决差动问题?
海归主坛
2010-4-21 周三, 07:30
返回顶端
再来篇搜索的,兼回小周。中文搜索的分词技术 演示
--
不说难受
- (172 Byte) 2005-8-19 周五, 01:04
(2142 reads)
专题搜索又回来了。
--
保尔
- (590 Byte) 2005-8-19 周五, 15:50
(386 reads)
保尔的路是综合化大众化又有专业的搜索
--
不说难受
- (305 Byte) 2005-8-19 周五, 21:50
(362 reads)
只要练着就有机会,有时发展起来只需要很短时间。
--
保尔
- (0 Byte) 2005-8-19 周五, 23:43
(183 reads)
期待看不说难受公布分词的程序。
--
benfangd
- (231 Byte) 2005-8-19 周五, 09:15
(412 reads)
这个东西很有意思,同期待。到时行的话,转成vc++版试试看
--
traveller
- (0 Byte) 2005-8-20 周六, 11:16
(174 reads)
我的版本是Java的总共,没有三百行code,也是根据一个网上的版本写的,周末整理一下贴出来。
--
不说难受
- (0 Byte) 2005-8-19 周五, 09:30
(364 reads)
汉语分词系统都有得下载了。除非有独到之处,没有必要自己搞。
--
tutu
- (1945 Byte) 2005-8-19 周五, 07:35
(566 reads)
A lot of researchers have been working on this for a long time
--
SOA
- (311 Byte) 2005-8-20 周六, 02:40
(287 reads)
太好了,谢谢,谢谢,这下我的词库要大不少。看来国内还是有人在搞学问的, 要是在搞个Java版就好了。 neo, 那有字典下载: http://www.nlp.org.cn/
--
不说难受
- (0 Byte) 2005-8-19 周五, 09:20
(397 reads)
不错,谢了!
--
neo
- (0 Byte) 2005-8-19 周五, 22:09
(171 reads)
中文_不比_英文_,_词_与_词_之间_有空_格_分开
--
对门子
- (26 Byte) 2005-8-19 周五, 02:17
(421 reads)
请教:中文分词需要字典,语法分析怎么搞呢?没头绪耶!
--
neo
- (0 Byte) 2005-8-19 周五, 04:07
(317 reads)
这是最麻烦的。 关键是中文没有语法。
--
对门子
- (29 Byte) 2005-8-19 周五, 04:20
(308 reads)
下雨天_留客_天_留_我_不留
--
redbook
- (23 Byte) 2005-8-19 周五, 02:27
(490 reads)
人都分不清,机器可不瞎分。古文,没发。
--
不说难受
- (0 Byte) 2005-8-19 周五, 04:35
(281 reads)
“格”字单独不成词的。
--
对门子
- (55 Byte) 2005-8-19 周五, 03:02
(422 reads)
古文诗词更是难分啊
--
neo
- (0 Byte) 2005-8-19 周五, 03:19
(298 reads)
对门子一针见血,本人感觉只要有时间有力气,做到90%准确是没有问题的。
--
不说难受
- (0 Byte) 2005-8-19 周五, 03:12
(371 reads)
那我就再来一针: 语法不全是中文的特点和文风, 如之奈何。
--
对门子
- (200 Byte) 2005-8-19 周五, 04:17
(409 reads)
国内有几家自动翻译软件公司,自动翻译软件是需要语法分析技术的。
--
tutu
- (0 Byte) 2005-8-19 周五, 07:37
(356 reads)
不知道这些公司活得好不好。 有钱了, 把他们收归麾下
--
对门子
- (128 Byte) 2005-8-19 周五, 09:21
(298 reads)
别着急,搜索只关心词,句法完整性并不重要
--
沉石
- (47 Byte) 2005-8-19 周五, 05:20
(371 reads)
正确,在整句搜索方面,百度做得很糟糕,Google稍微好一些;但句子搜索确实不是很常用,所以开始不用拘泥于此
--
neo
- (0 Byte) 2005-8-19 周五, 07:05
(282 reads)
但您的Ranking算法好象有问题,试了几个中文search,好象给出的东西都不是偶想要的
--
neo
- (0 Byte) 2005-8-19 周五, 01:47
(354 reads)
的确这样。这正是我现在伤脑筋的地方。调试算法费时费力。一天才可INDEX一遍,然后发现不合适,又要从头来一边。
--
不说难受
- (0 Byte) 2005-8-19 周五, 02:02
(286 reads)
试了篇长的,分得很精准,准确率达70%,期待公布程序。
--
neo
- (113 Byte) 2005-8-19 周五, 01:41
(420 reads)
我想把分词部分与我的其他程序分开,然后把中文分词变为开放源码,大约两周时间见。
--
不说难受
- (0 Byte) 2005-8-19 周五, 02:08
(283 reads)
请问你的MSN是多少》我最近正在进行这方面的研究,希望我们双方可以合作。
--
文成武德周,乾坤日月明,天地正
- (284 Byte) 2005-8-19 周五, 01:17
(413 reads)
不瞒小周,我与世隔绝,还没有MSN的户头,周末让我注一个后与你联系。
--
不说难受
- (0 Byte) 2005-8-19 周五, 01:56
(276 reads)
您帖子被分为:
--
neo
- (278 Byte) 2005-8-19 周五, 01:09
(395 reads)
显示文章:
所有文章
1天
7天
2周
1个月
3个月
6个月
1年
时间顺序
时间逆序
海归论坛首页
->
海归商务
焦点讨论
|
精华区
|
嘉宾沙龙
|
白领丽人沙龙
所有的时间均为 北京时间
论坛转跳:
您
不能
在本论坛发表新主题,
不能
回复主题,
不能
编辑自己的文章,
不能
删除自己的文章,
不能
发表投票, 您
不可以
发表活动帖子在本论坛,
不能
添加附件
不能
下载文件,
热门标签
更多...
论坛精华荟萃
更多...
博客热门文章
更多...
海归网二次开发,based on phpbb
Copyright © 2005-2024 Haiguinet.com. All rights reserved.