调查整理了一番,主要有以下几种实现方案:

  1. 使用Solr的正则

    参考:

    http://stackoverflow.com/questions/364301/solr-using-regex-fragmenter-to-extract-paragraphs