请问这个应该怎么写
识别### 章节,返回 章节
我这原来那个是这样写的,可是总是出错.比如如果文本里有数字开头的,还是会识别成章节,
//匹配分卷名
$jieqiImporttxt['volume'] = array('preg' => '/^[#]{0,2}\s*(第\s*([0-9]|零|一|二|三|四|五|六|七|八|九|十)+卷.*)$/', 'no' => 1, 'maxlen' => 60, 'tagmatch' => '/(章|节|卷|话).*([0-9]|零|一|二|三|四|五|六|七|八|九|十)|([0-9]|零|一|二|三|四|五|六|七|八|九|十).*(章|节|卷|话)/');
//匹配章节名
$jieqiImporttxt['chapter'] = array('preg' => '/^[#]{0,3}\s*([第|Chapter|chapter]*\s*([0-9]|零|一|二|三|四|五|六|七|八|九|十)+[章]*.*)\s*$/', 'no' => 1, 'maxlen' => 60, 'tagmatch' => '/(章|节|卷|话).*([0-9]|零|一|二|三|四|五|六|七|八|九|十)|([0-9]|零|一|二|三|四|五|六|七|八|九|十).*(章|节|卷|话)/');
这个你需要给出待匹配的原文,才知道什么问题。
但是作为一个原则,你需要知道,正则表达式适合匹配正规文本,而不是做NLP