SolrUtil.java 23 KB


  1. package com.yihu.ehr.solr;
  2. import org.apache.commons.lang3.StringUtils;
  3. import org.apache.solr.client.solrj.SolrClient;
  4. import org.apache.solr.client.solrj.SolrQuery;
  5. import org.apache.solr.client.solrj.response.*;
  6. import org.apache.solr.common.SolrDocumentList;
  7. import org.apache.solr.common.params.FacetParams;
  8. import org.apache.solr.common.params.GroupParams;
  9. import org.apache.solr.common.util.NamedList;
  10. import org.slf4j.Logger;
  11. import org.slf4j.LoggerFactory;
  12. import org.springframework.beans.factory.annotation.Autowired;
  13. import org.springframework.beans.factory.config.ConfigurableBeanFactory;
  14. import org.springframework.context.annotation.Scope;
  15. import org.springframework.stereotype.Service;
  16. import java.util.*;
  17. /**
  18. * Solr底层查询类
  19. *
  20. * @author hzp
  21. * @version 1.0
  22. * @created 2016.04.26
  23. */
  24. @Service
  25. @Scope(ConfigurableBeanFactory.SCOPE_PROTOTYPE)
  26. public class SolrUtil {
  27. private static final Logger logger = LoggerFactory.getLogger(SolrUtil.class);
  28. private final static String ASC = "asc";
  29. @Autowired
  30. private SolrPool pool;
  31. /**
  32. * 简单查询方法
  33. */
  34. public SolrDocumentList query(String core, String q, Map<String, String> sort, long start, long rows) throws Exception {
  35. return query(core, q, null, sort, start, rows, null);
  36. }
  37. /**
  38. * 简单查询返回字段
  39. */
  40. public SolrDocumentList queryReturnFieldList(String core, String q, String fq, Map<String, String> sort, long start, long rows, String... fields) throws Exception {
  41. return query(core, q, fq, sort, start, rows, fields);
  42. }
  43. /**
  44. * Solr查询方法
  45. * @param core
  46. * @param q 查询字符串
  47. * @param fq 过滤查询
  48. * @param sort 排序
  49. * @param start 查询起始行
  50. * @param rows 查询行数
  51. * @param fields 返回字段
  52. * @return
  53. */
  54. public SolrDocumentList query(String core, String q, String fq, Map<String, String> sort, long start, long rows, String... fields) throws Exception {
  55. SolrClient conn = pool.getConnection(core);
  56. SolrQuery query = new SolrQuery();
  57. //设置查询条件
  58. if (StringUtils.isNotEmpty(q)) {
  59. query.setQuery(q);
  60. } else {
  61. query.setQuery("*:*");
  62. }
  63. //设置过滤条件
  64. if (StringUtils.isNotEmpty(fq)) {
  65. query.setFilterQueries(fq);
  66. }
  67. query.setFields(fields);
  68. //设置查询起始行
  69. query.setStart(Integer.parseInt(String.valueOf(start)));
  70. //设置查询行数
  71. query.setRows(Integer.parseInt(String.valueOf(rows)));
  72. //设置排序
  73. if (sort != null) {
  74. for (Object co : sort.keySet()) {
  75. if (ASC.equals(sort.get(co).toLowerCase())) {
  76. query.addSort(co.toString(), SolrQuery.ORDER.asc);
  77. } else {
  78. query.addSort(co.toString(), SolrQuery.ORDER.desc);
  79. }
  80. }
  81. }
  82. QueryResponse rsp = conn.query(query);
  83. SolrDocumentList docs = rsp.getResults();
  84. return docs;
  85. }
  86. /**
  87. * Solr查询方法
  88. * @param core
  89. * @param q 查询字符串
  90. * @param fq 过滤查询
  91. * @param sort 排序
  92. * @param start 查询起始行
  93. * @param rows 查询行数
  94. * @param hl 高亮字段
  95. * @param fields 返回字段
  96. * @return
  97. * @throws Exception
  98. */
  99. public QueryResponse highlight(String core, String q, String fq, Map<String, String> sort, long start, long rows, String hl, String... fields) throws Exception {
  100. SolrClient conn = pool.getConnection(core);
  101. SolrQuery query = new SolrQuery();
  102. //设置查询条件
  103. if (StringUtils.isNotEmpty(q)) {
  104. query.setQuery(q);
  105. } else {
  106. query.setQuery("*:*");
  107. }
  108. //设置过滤条件
  109. if (StringUtils.isNotEmpty(fq)) {
  110. query.setFilterQueries(fq);
  111. }
  112. query.setFields(fields);
  113. //设置查询起始行
  114. query.setStart(Integer.parseInt(String.valueOf(start)));
  115. //设置查询行数
  116. query.setRows(Integer.parseInt(String.valueOf(rows)));
  117. //设置排序
  118. if (sort != null) {
  119. for (Object co : sort.keySet()) {
  120. if (ASC.equals(sort.get(co).toLowerCase())) {
  121. query.addSort(co.toString(), SolrQuery.ORDER.asc);
  122. } else {
  123. query.addSort(co.toString(), SolrQuery.ORDER.desc);
  124. }
  125. }
  126. }
  127. //高亮
  128. if (StringUtils.isNotEmpty(hl)) {
  129. query.setHighlight(true);
  130. query.addHighlightField(hl);
  131. query.setHighlightSimplePre("<em>");
  132. query.setHighlightSimplePost("</em>");
  133. query.setHighlightFragsize(3000);
  134. }
  135. QueryResponse rsp = conn.query(query);
  136. return rsp;
  137. }
  138. /**
  139. * Solr单个字段去重查询
  140. *
  141. * @param q 可选,查询字符串
  142. * @param fq 可选,过滤查询
  143. * @param sort 可选,排序
  144. * @param start 必填,查询起始行
  145. * @param rows 必填,查询行数
  146. * @param fields 必填,返回字段
  147. * @param groupField 必填,分组去重字段。针对一个字段去重。
  148. * @param groupSort 可选,组内排序字段,如:"event_date asc"
  149. * @return
  150. */
  151. public List<Group> queryDistinctOneField(String core, String q, String fq, Map<String, String> sort, int start, int rows,
  152. String[] fields, String groupField, String groupSort) throws Exception {
  153. SolrClient conn = pool.getConnection(core);
  154. SolrQuery query = new SolrQuery();
  155. if (StringUtils.isNotEmpty(q)) {
  156. query.setQuery(q);
  157. } else {
  158. query.setQuery("*:*");
  159. }
  160. if (StringUtils.isNotEmpty(fq)) {
  161. query.setFilterQueries(fq);
  162. }
  163. if (sort != null) {
  164. for (Object co : sort.keySet()) {
  165. if (ASC.equals(sort.get(co).toLowerCase())) {
  166. query.addSort(co.toString(), SolrQuery.ORDER.asc);
  167. } else {
  168. query.addSort(co.toString(), SolrQuery.ORDER.desc);
  169. }
  170. }
  171. }
  172. query.setFields(fields);
  173. query.setStart(start);
  174. query.setRows(10000000);
  175. query.setParam(GroupParams.GROUP, true);
  176. query.setParam(GroupParams.GROUP_FORMAT, "grouped");
  177. query.setParam(GroupParams.GROUP_FIELD, groupField);
  178. if (StringUtils.isNotEmpty(groupSort)) {
  179. query.setParam(GroupParams.GROUP_SORT, groupSort);
  180. }
  181. List<Group> groups = new ArrayList<>();
  182. QueryResponse response = conn.query(query);
  183. GroupResponse groupResponse = response.getGroupResponse();
  184. if (groupResponse != null) {
  185. List<GroupCommand> groupList = groupResponse.getValues();
  186. for (GroupCommand groupCommand : groupList) {
  187. groups = groupCommand.getValues();
  188. }
  189. }
  190. return groups;
  191. }
  192. /**
  193. * Solr单个字段去重查询
  194. *
  195. * @param q 可选,查询字符串
  196. * @param fq 可选,过滤查询
  197. * @param sort 可选,排序
  198. * @param start 必填,查询起始行
  199. * @param rows 必填,查询行数
  200. * @param fields 必填,返回字段
  201. * @param groupField 必填,分组去重字段。针对一个字段去重。
  202. * @param groupSort 可选,组内排序字段,如:"event_date asc"
  203. * @return
  204. */
  205. public SolrDocumentList queryDistinctOneFieldForDocList(String core, String q, String fq, Map<String, String> sort, int start, int rows,
  206. String[] fields, String groupField, String groupSort) throws Exception {
  207. SolrDocumentList solrDocumentList = new SolrDocumentList();
  208. SolrClient conn = pool.getConnection(core);
  209. SolrQuery query = new SolrQuery();
  210. QueryResponse response = conn.query(query);
  211. GroupResponse groupResponse = response.getGroupResponse();
  212. if (groupResponse != null) {
  213. List<GroupCommand> groupList = groupResponse.getValues();
  214. for (GroupCommand groupCommand : groupList) {
  215. List<Group> groups = groupCommand.getValues();
  216. for (Group group : groups) {
  217. if (group.getResult().size() > 0) {
  218. solrDocumentList.add(group.getResult().get(0));
  219. }
  220. }
  221. }
  222. }
  223. return solrDocumentList;
  224. }
  225. /**
  226. * Solr查询方法 多个过滤条件
  227. *
  228. * @param q 查询字符串
  229. * @param fq 过滤查询 多个过滤条件
  230. * @param sort 排序
  231. * @param start 查询起始行
  232. * @param rows 查询行数
  233. * @return
  234. */
  235. public SolrDocumentList queryByfqs(String core, String q, String[] fq, Map<String, String> sort, long start, long rows) throws Exception {
  236. SolrClient conn = pool.getConnection(core);
  237. SolrQuery query = new SolrQuery();
  238. if (null != q && !q.equals("")) {
  239. query.setQuery(q);
  240. } else {
  241. query.setQuery("*:*");
  242. }
  243. if (null != fq && fq.length > 0) {
  244. query.setFilterQueries(fq);
  245. }
  246. //设置查询起始行
  247. query.setStart(Integer.parseInt(String.valueOf(start)));
  248. //设置查询行数
  249. query.setRows(Integer.parseInt(String.valueOf(rows)));
  250. //设置排序
  251. if (sort != null) {
  252. for (Object co : sort.keySet()) {
  253. if (ASC == sort.get(co).toLowerCase() || ASC.equals(sort.get(co).toLowerCase())) {
  254. query.addSort(co.toString(), SolrQuery.ORDER.asc);
  255. } else {
  256. query.addSort(co.toString(), SolrQuery.ORDER.desc);
  257. }
  258. }
  259. }
  260. QueryResponse rsp = conn.query(query);
  261. return rsp.getResults();
  262. }
  263. /**
  264. * 总数查询方法
  265. */
  266. public long count(String core, String q) throws Exception {
  267. return count(core, q, null);
  268. }
  269. /**
  270. * 总数查询方法
  271. */
  272. public long count(String core, String q, String fq) throws Exception {
  273. SolrClient conn = pool.getConnection(core);
  274. SolrQuery query = new SolrQuery();
  275. //设置查询条件
  276. if (null != q && !q.equals("")) {
  277. query.setQuery(q);
  278. } else {
  279. query.setQuery("*:*");
  280. }
  281. if (null != fq && !fq.equals("")) {
  282. query.setFilterQueries(fq);
  283. }
  284. query.setStart(0);
  285. query.setRows(0);
  286. QueryResponse rsp = conn.query(query);
  287. long count = rsp.getResults().getNumFound();
  288. return count;
  289. }
  290. /**
  291. * 单组分组Count统计(start从0开始)
  292. *
  293. * @param core core名
  294. * @param q 查询条件
  295. * @param fq 筛选条件
  296. * @param groupField 分组字段名
  297. * @param start 起始偏移位
  298. * @param limit 结果条数,为负数则不限制
  299. */
  300. public Map<String, Long> groupCount(String core, String q, String fq, String groupField, int start, int limit) throws Exception {
  301. SolrClient conn = pool.getConnection(core);
  302. SolrQuery query = new SolrQuery();
  303. if (null != q && !q.equals("")) {
  304. query.setQuery(q);
  305. } else {
  306. query.setQuery("*:*");
  307. }
  308. if (null != fq && !fq.equals("")) {
  309. query.setFilterQueries(fq);
  310. }
  311. //设置facet=on
  312. query.setFacet(true);
  313. query.setRows(0);
  314. query.addFacetField(groupField);
  315. //限制每次返回结果数
  316. query.setFacetLimit(limit);
  317. query.set(FacetParams.FACET_OFFSET, start);
  318. //不统计null的值
  319. query.setFacetMissing(false);
  320. // 设置返回的数据中每个分组的数据最小值,比如设置为0,则统计数量最小为0,不然不显示
  321. query.setFacetMinCount(0);
  322. QueryResponse rsp = conn.query(query);
  323. List<FacetField.Count> countList = rsp.getFacetField(groupField).getValues();
  324. Map<String, Long> rmap = new HashMap<>();
  325. for (FacetField.Count count : countList) {
  326. if (count.getCount() > 0)
  327. rmap.put(count.getName(), (long) count.getCount());
  328. }
  329. return rmap;
  330. }
  331. /**
  332. * 单组分组Count统计(start从0开始),筛选出聚合值>=groupCount
  333. *
  334. * @param core core名
  335. * @param q 查询条件
  336. * @param fq 筛选条件
  337. * @param groupField 分组字段名
  338. * @param start 起始偏移位
  339. * @param limit 结果条数,为负数则不限制
  340. * @param groupCount 聚合值
  341. */
  342. public Map<String, Long> groupCountLte(String core, String q, String fq, String groupField, int start, int limit, int groupCount) throws Exception {
  343. SolrClient conn = pool.getConnection(core);
  344. SolrQuery query = new SolrQuery();
  345. if (null != q && !q.equals("")) {
  346. query.setQuery(q);
  347. } else {
  348. query.setQuery("*:*");
  349. }
  350. if (null != fq && !fq.equals("")) {
  351. query.setFilterQueries(fq);
  352. }
  353. //设置facet=on
  354. query.setFacet(true);
  355. query.setRows(0);
  356. query.addFacetField(groupField);
  357. //限制每次返回结果数
  358. query.setFacetLimit(limit);
  359. query.set(FacetParams.FACET_OFFSET, start);
  360. //不统计null的值
  361. query.setFacetMissing(false);
  362. // 设置返回的数据中每个分组的数据最小值,比如设置为0,则统计数量最小为0,不然不显示
  363. query.setFacetMinCount(0);
  364. QueryResponse rsp = conn.query(query);
  365. List<FacetField.Count> countList = rsp.getFacetField(groupField).getValues();
  366. Map<String, Long> rmap = new HashMap<>();
  367. for (FacetField.Count count : countList) {
  368. if (count.getCount() >= groupCount) {
  369. rmap.put(count.getName(), (long) count.getCount());
  370. }
  371. }
  372. return rmap;
  373. }
  374. /**
  375. * 多组分组Count(独立计算)
  376. *
  377. * @param core core名
  378. * @param q 查询条件
  379. * @param fq 筛选条件
  380. * @param groupFields 分组字段名
  381. */
  382. public List<FacetField> groupCount(String core, String q, String fq, String[] groupFields) throws Exception {
  383. SolrClient conn = pool.getConnection(core);
  384. SolrQuery query = new SolrQuery();
  385. if (null != q && !q.equals("")) {
  386. query.setQuery(q);
  387. } else {
  388. query.setQuery("*:*");
  389. }
  390. if (null != fq && !fq.equals("")) {
  391. query.setFilterQueries(fq);
  392. }
  393. //设置facet=on
  394. query.setFacet(true);
  395. query.setRows(0);
  396. query.addFacetField(groupFields);
  397. // 限制每次返回结果数
  398. query.setFacetLimit(-1);
  399. query.set(FacetParams.FACET_OFFSET, 0);
  400. // 不统计null的值
  401. query.setFacetMissing(false);
  402. // 设置返回的数据中每个分组的数据最小值,比如设置为0,则统计数量最小为0,不然不显示
  403. query.setFacetMinCount(0);
  404. QueryResponse rsp = conn.query(query);
  405. return rsp.getFacetFields();
  406. }
  407. /**
  408. * 多组分组Count统计(关联计算)
  409. *
  410. * @param core core名
  411. * @param q 查询条件
  412. * @param fq 筛选条件
  413. * @param groupFields 分组字段名
  414. * @param start 起始偏移位
  415. * @param limit 结果条数,为负数则不限制
  416. */
  417. public List<PivotField> groupCountMult(String core, String q, String fq, String groupFields, int start, int limit) throws Exception {
  418. SolrClient conn = pool.getConnection(core);
  419. SolrQuery query = new SolrQuery();
  420. if (null != q && !q.equals("")) {
  421. query.setQuery(q);
  422. } else {
  423. query.setQuery("*:*");
  424. }
  425. if (null != fq && !fq.equals("")) {
  426. query.setFilterQueries(fq);
  427. }
  428. //设置facet=on
  429. query.setFacet(true);
  430. query.setRows(0);
  431. query.addFacetPivotField(groupFields);
  432. query.set(FacetParams.FACET_OFFSET, start);
  433. //限制每次返回结果数
  434. query.setFacetLimit(limit);
  435. //不统计null的值
  436. query.setFacetMissing(false);
  437. // 设置返回的数据中每个分组的数据最小值,比如设置为0,则统计数量最小为0,不然不显示
  438. query.setFacetMinCount(0);
  439. QueryResponse rsp = conn.query(query);
  440. NamedList<List<PivotField>> namedList = rsp.getFacetPivot();
  441. if (namedList != null && namedList.size() > 0) {
  442. return namedList.getVal(0);
  443. } else {
  444. return null;
  445. }
  446. }
  447. /**
  448. * 分组数值统计
  449. *
  450. * @param core 表名
  451. * @param q 查询条件
  452. * @param statsField 统计字段
  453. * @return
  454. */
  455. public FieldStatsInfo getStats(String core, String q, String fq, String statsField) throws Exception {
  456. SolrClient conn = pool.getConnection(core);
  457. SolrQuery query = new SolrQuery();
  458. if (null != q && !q.equals("")) {
  459. query.setQuery(q);
  460. } else {
  461. query.setQuery("*:*");
  462. }
  463. if (null != fq && !fq.equals("")) {
  464. query.setFilterQueries(fq);
  465. }
  466. query.addGetFieldStatistics(statsField);
  467. query.setRows(0);
  468. QueryResponse rsp = conn.query(query);
  469. Map<String, FieldStatsInfo> stats = rsp.getFieldStatsInfo();
  470. if (stats != null && stats.size() > 0) {
  471. return stats.get(statsField);
  472. }
  473. return null;
  474. }
  475. /**
  476. * 分组数值统计
  477. *
  478. * @param core 表名
  479. * @param q 查询条件
  480. * @param statsField 统计字段
  481. * @param groupField 分组字段
  482. * @return
  483. */
  484. public List<FieldStatsInfo> getStats(String core, String q, String fq, String statsField, String groupField) throws Exception {
  485. SolrClient conn = pool.getConnection(core);
  486. SolrQuery query = new SolrQuery();
  487. if (null != q && !q.equals("")) {
  488. query.setQuery(q);
  489. } else {
  490. query.setQuery("*:*");
  491. }
  492. if (null != fq && !fq.equals("")) {
  493. query.setFilterQueries(fq);
  494. }
  495. query.addGetFieldStatistics(statsField);
  496. query.addStatsFieldFacets(statsField, groupField);
  497. query.setRows(0);
  498. QueryResponse rsp = conn.query(query);
  499. Map<String, FieldStatsInfo> stats = rsp.getFieldStatsInfo();
  500. if (stats != null && stats.size() > 0) {
  501. Map<String, List<FieldStatsInfo>> map = stats.get(statsField).getFacets();
  502. if (map != null) {
  503. return map.get(groupField);
  504. }
  505. }
  506. return null;
  507. }
  508. /**
  509. * 查询统计
  510. *
  511. * @param core core名
  512. * @param facetQuery 查询条件
  513. */
  514. public Map<String, Integer> getFacetQuery(String core, String facetQuery) throws Exception {
  515. SolrClient conn = pool.getConnection(core);
  516. SolrQuery query = new SolrQuery();
  517. query.setQuery("*:*");
  518. query.setFacet(true);
  519. query.addFacetQuery(facetQuery);
  520. QueryResponse resp = conn.query(query);
  521. return resp.getFacetQuery();
  522. }
  523. /**
  524. * 单字段分组统计
  525. *
  526. * @param core
  527. * @param facetField
  528. * @param fq
  529. * @param minCount
  530. * @param start
  531. * @param limit
  532. * @param missing
  533. */
  534. public FacetField getFacetField(String core, String facetField, String fq, int minCount, int start, int limit, boolean missing) throws Exception {
  535. SolrClient conn = pool.getConnection(core);
  536. SolrQuery query = new SolrQuery();
  537. query.setQuery("*:*");
  538. if (!StringUtils.isBlank(fq)) {
  539. query.setFilterQueries(fq);
  540. }
  541. query.setStart(start)
  542. .setRows(0)
  543. .setFacet(true)
  544. .addFacetField(facetField)
  545. .setFacetMinCount(minCount)
  546. .setFacetLimit(limit)
  547. .setFacetMissing(missing);
  548. QueryResponse resp = conn.query(query);
  549. return resp.getFacetField(facetField);
  550. }
  551. /**
  552. * 日期范围分组统计
  553. */
  554. public List<RangeFacet> getFacetDateRange(String core, String dateField, Date startTime, Date endTime, String gap, String fq) throws Exception {
  555. SolrClient conn = pool.getConnection(core);
  556. SolrQuery query = new SolrQuery();
  557. query.setQuery("*:*");
  558. if (!StringUtils.isBlank(fq)) {
  559. query.setFilterQueries(fq);
  560. }
  561. query.setRows(0)
  562. .setFacet(true)
  563. .addDateRangeFacet(dateField, startTime, endTime, gap);
  564. QueryResponse resp = conn.query(query);
  565. return resp.getFacetRanges();
  566. }
  567. /**
  568. * 日期范围分组统计
  569. */
  570. public List<RangeFacet> getFacetDateRange(String core, String field, String start, String end, String gap, String fq, String q) throws Exception {
  571. SolrClient conn = pool.getConnection(core);
  572. SolrQuery query = new SolrQuery();
  573. if (StringUtils.isEmpty(q)) {
  574. query.setQuery("*:*");
  575. } else {
  576. query.setQuery(q);
  577. }
  578. if (!StringUtils.isEmpty(fq)) {
  579. query.setFilterQueries(fq);
  580. }
  581. query.setRows(0)
  582. .setFacet(true)
  583. .setFacetMissing(false)
  584. .add("facet.range", new String[]{field})
  585. .add(String.format(Locale.ROOT, "f.%s.%s", new Object[]{field, "facet.range.start"}), new String[]{start})
  586. .add(String.format(Locale.ROOT, "f.%s.%s", new Object[]{field, "facet.range.end"}), new String[]{end})
  587. .add(String.format(Locale.ROOT, "f.%s.%s", new Object[]{field, "facet.range.gap"}), new String[]{gap});
  588. QueryResponse resp = conn.query(query);
  589. return resp.getFacetRanges();
  590. }
  591. /**
  592. * 数值型字段范围统计
  593. */
  594. public List<RangeFacet> getFacetNumRange(String core, String field, int start, int end, int gap, String fq) throws Exception {
  595. SolrClient conn = pool.getConnection(core);
  596. SolrQuery query = new SolrQuery();
  597. query.setQuery("*:*");
  598. if (!StringUtils.isBlank(fq)) {
  599. query.setFilterQueries(fq);
  600. }
  601. query.setRows(0)
  602. .setFacet(true)
  603. .addNumericRangeFacet(field, start, end, gap);
  604. QueryResponse resp = conn.query(query);
  605. return resp.getFacetRanges();
  606. }
  607. }