游客,您好!      登录

帮助

检索表达式
现搜索引擎普遍用的检索方式,本系统均支持。文档只列出最常用的几种。
1、指定字段查询
本系统支持多字段数据,在查询时可以使用默认的字段查询,也可以指定一个字段查询。你可以使用“字段名:查询词”来指定字段名查询。
例如:
IR_URLTITLE:钓鱼岛事件
IR_URLTITLE:舆情 AND 系统安装
2、通配符查询
匹配单一字符使用符号“?”,匹配多个字符使用符号“*”
“*:*”查询所有记录
注意:不能将“*”和“?”放在第一个字符来查询。(出于性能考虑,所以不支持该功能)
例如:
IR_AUTHORS:王*
3、布尔查询
OR :只要包含其中一个查询词,便可以查询出记录
AND:所有的查询词都出现才能满足查询条件,是默认的连接操作符
NOT:不包含NOT后面的查询词(注:不能使用在单独查询词中)
中国 NOT 日本(包含“中国”,不包含日本)
NOT 中国 将不返回任何结果
+: 操作符后面的查询词必须出现
+中国 OR 日本(“中国”必须包含,“日本”可以包含也可以不包含)
- : 与NOT类似
4、指定距离查询 ~
本系统支持指定距离查询,你可以使用波浪号“~”加数字在查询词后。
"中国 政府" ~10 (“中国”与“政府”距离10个字符以内)
5、范围查询
范围查询允许你指定某个字段最大值和最小值,查询在二者之间的所有记录,适用于NUMBER、CHAR、DATE类型字段。范围查询可以包含或者不包含最大值和最小值,包含用[表示,不包含用{表示。
IR_URLTIME:[2010.01.01 TO 2012.10.01] ( 2010.01.01≤日期 ≤2012.10.01)
IR_URLTIME:{2010.01.01 TO 2012.10.01} (2010.01.01< 日期 <2012.10.01)
IR_URLTIME:[2010.01.01 TO *} (日期 ≥2010.01.01)
IR_URLTIME:[* TO 2012.10.01} (日期 ≤2012.10.01)
6、日期字段查询
查询日期字段时,可用的日期格式有:
yyyy/MM/dd HH:mm:ss
yyyy.MM.dd HH:mm:ss
yyyy-MM-dd HH:mm:ss
yyyyMMddHHmmss
注意,当使用斜杠分隔时,需要用双引号引用起来,否则查询不到期望的结果。
一般情况,时分秒部分可以忽略不写,这部分默认为00:00:00。当检索表达式为yyyy.MM时,会当作查询yyyy.MM.01,查询yyyy时,会当作查询yyyy.01.01。所以,当需要查询某年的记录时,不要用yyyy来查询,而是用范围查询。
7、分组
本系统支持使用圆括号来将查询表达式分组,这将在控制布尔查询中非常有用。
IR_AUTHORS:支林飞 AND 戚德良(作者里包含“支林飞”、正文里包含“戚德良”的记录,假设缺省检索字段是正文)
IR_AUTHORS:(支林飞 AND 戚德良)(作者里包含“支林飞”与“戚德良”的记录)
这种语法对消除歧义,确保查询表达式的正确性具有很大的意义。
8、引用
如果希望检索不被拆分,可以用双引号将检索词引用起来。
"中国政府"
9、多个值查询
如果某个字段想查多个值,可以使用#LIST来代替OR去拼接,仅支持CHAR类型字段。
IR_AUTHORS#LIST:支林飞, 戚德良(作者里包含“支林飞”或“戚德良”的记录)
注意区分:
中国政府:分词后,连接操作符是AND,文档中必须包含有“中国”和“政府”
"中国政府":文档必须包含“中国政府”