雅酷SEO论坛

 找回密码
 立即注册

QQ登录

只需一步,快速开始

查看: 579|回复: 0
打印 上一主题 下一主题

什么是分词技术

[复制链接]

749

主题

0

好友

6715

积分

论坛元老

Rank: 8Rank: 8

  • TA的每日心情
    开心
    2015-12-24 14:22
  • 签到天数: 121 天

    连续签到: 4 天

    [LV.7]常住居民III

    跳转到指定楼层
    楼主
    发表于 2015-8-26 11:41:53 |只看该作者 |倒序浏览
    分词技术:什么是分词, 如何分词搜索引擎会承认,这次第一位朋友提的问题,想必大家也听说过,很好奇,什么是分词技术,什么又是百度分词呢?分词大家容易理解。就是一段词用字符分开,比如标点符号,空格等。zgnpxw.com
        那什么叫分词技术呢?分词技术就是SE针对用户提交查询的关键串进行的查询处理后根据用户的关键词串用各种匹配方法进行的一种技术。大家好好理解。那么我们要理解分词技术先要理解一个概念。那就是查询处理,当用户向搜索引擎提交查询后,搜索引擎接收到用户的信息要做一系列的处理。首先是到数据库里面索引相关的信息,这就是查询处理,那么查询处理又是如何工作的呢?很简单,把用户提交的字符串没有超过3个的中文字,就会直接到数据库索引词汇。超过4个中文字的,首先用分隔符比如空格,标点符号,将查询串分割成若干子查询串。
        举个例子。“什么是百度分词技术” 我们就会把这个词分割成“ 什么是,百度,分词技术。”这种分词方法叫做反向匹配法。2.然后再看用户提供的这个词有没有重复词汇。
        如果有的话,会丢弃掉,默认为一个词汇。接下来检查用户提交的字符串,有没有字母和数字。
        如果有的话,就把字母和数字认为一个词。好了,这就是SE的查询处理。
        讲了查询处理后,大家对分词技术,尤其是中文分词技术有了一个基本的了解。zgzybdf.com

    分享到: QQ空间QQ空间 腾讯微博腾讯微博 腾讯朋友腾讯朋友
    分享淘帖0 分享分享0 收藏收藏0 支持支持0 反对反对0
    回复

    使用道具 举报

    您需要登录后才可以回帖 登录 | 立即注册

    百度SEO教程|谷歌SEO学术|百度SEO谷歌|网站SEO优化|雅酷SEO论坛  

    GMT+8, 2024-11-29 19:55

    Powered by Discuz! X2.5

    © 2001-2012 Comsenz Inc.

    回顶部