主頁(yè) > 知識(shí)庫(kù) > 關(guān)于日期正則表達(dá)式的思路詳解

關(guān)于日期正則表達(dá)式的思路詳解

熱門(mén)標(biāo)簽:呼叫系統(tǒng)外呼只能兩次 西藏智能外呼系統(tǒng)代理商 貴港公司如何申請(qǐng)400電話 地圖標(biāo)注教學(xué)點(diǎn) 400電話辦理電話辦理 ai電話機(jī)器人搭建 甘肅醫(yī)療外呼系統(tǒng)排名 外呼系統(tǒng)無(wú)呼出路由是什么原因 梅縣地圖標(biāo)注

1        概述

首先需要說(shuō)明的一點(diǎn),無(wú)論是Winform,還是Webform,都有很成熟的日歷控件,無(wú)論從易用性還是可擴(kuò)展性上看,日期的選擇和校驗(yàn)還是用日歷控件來(lái)實(shí)現(xiàn)比較好。

前幾天在CSDN多個(gè)版塊看到需要日期正則的帖子,所以整理了這篇文章,和大家一起討論交流,如有遺漏或錯(cuò)誤的地方,還請(qǐng)大家指正。

日期正則一般是對(duì)格式有要求,且數(shù)據(jù)不是直接由用戶(hù)輸入時(shí)使用。因應(yīng)用場(chǎng)景的不同,寫(xiě)出的正則也不同,復(fù)雜程度也自然不同。正則的書(shū)寫(xiě)需要根據(jù)具體情況具體分析,一個(gè)基本原則就是:只寫(xiě)合適的,不寫(xiě)復(fù)雜的。

對(duì)于日期提取,只要能與非日期區(qū)分開(kāi),寫(xiě)最簡(jiǎn)單的正則即可,如

\d{4}-\d{2}-\d{2}

如果可以在源字符串中唯一定位yyyy-MM-dd格式的日期,則可用做提取。

對(duì)于驗(yàn)證,如果僅僅是驗(yàn)證字符組成及格式是沒(méi)有多大意義的,還要加入對(duì)規(guī)則的校驗(yàn)。由于閏年的存在,使得日期的校驗(yàn)正則變得比較復(fù)雜。

先來(lái)考察一下日期的有效范圍以及什么是閏年。

2       日期的規(guī)則

2.1     日期的有效范圍

對(duì)于日期的有效范圍,不同的應(yīng)用場(chǎng)景會(huì)有所不同。

MSDN中定義的DateTime對(duì)象的有效范圍是:0001-01-01 00:00:00到9999-12-31 23:59:59。

UNIX時(shí)間戳的0按照ISO 8601規(guī)范為 :1970-01-01T00:00:00Z。

而實(shí)際應(yīng)用中,日期的范圍基本上不會(huì)超出DateTime所規(guī)定的范圍,所以正則驗(yàn)證取其中常用的日期范圍即可。

2.2     什么是閏年

(以下摘自百度百科)

閏年(leap year)是為了彌補(bǔ)因人為歷法規(guī)定造成的年度天數(shù)與地球?qū)嶋H公轉(zhuǎn)周期的時(shí)間差而設(shè)立的。補(bǔ)上時(shí)間差的年份為閏年。

地球繞日運(yùn)行周期為365天5小時(shí)48分46秒(合365.24219天),即一回歸年(tropical year)。公歷的平年只有365日,比回歸年短約0.2422 日,每四年累積約一天,把這一天加于2月末(即2月29日),使當(dāng)年時(shí)間長(zhǎng)度變?yōu)?66日,這一年就為閏年。

需要注意的是,現(xiàn)在的公歷是根據(jù)羅馬人的“儒略歷”改編而得。由于當(dāng)時(shí)沒(méi)有了解到每年要多算出0.0078天的問(wèn)題,從公元前46年,到16世紀(jì),一共累計(jì)多出了10天。為此,當(dāng)時(shí)的教皇格雷果里十三世,將1582年10月5日人為規(guī)定為10月15日。并開(kāi)始了新閏年規(guī)定。即規(guī)定公歷年份是整百數(shù)的,必須是400的倍數(shù)才是閏年,不是400的倍數(shù)的就是平年。比如,1700年、1800年和1900年為平年,2000年為閏年。此后,平均每年長(zhǎng)度為365.2425天,約4年出現(xiàn)1天的偏差。按照每四年一個(gè)閏年計(jì)算,平均每年就要多算出0.0078天,經(jīng)過(guò)四百年就會(huì)多出大約3天來(lái),因此,每四百年中要減少三個(gè)閏年。閏年的計(jì)算,歸結(jié)起來(lái)就是通常說(shuō)的:四年一閏;百年不閏,四百年再閏。

2.3     日期的格式

根據(jù)不同的語(yǔ)言文化,日期的連字符會(huì)有所不同,通常有以下幾種格式:

yyyyMMdd

yyyy-MM-dd

yyyy/MM/dd

yyyy.MM.dd

3       日期正則表達(dá)式構(gòu)建

3.1     規(guī)則分析

寫(xiě)復(fù)雜正則的一個(gè)常用方法,就是先把不相關(guān)的需求拆分開(kāi),分別寫(xiě)出對(duì)應(yīng)的正則,然后組合,檢查一下相互的關(guān)聯(lián)關(guān)系以及影響,基本上就可以得出對(duì)應(yīng)的正則。

按閏年的定義可知,日期可以有幾種分類(lèi)方法。

3.1.1  根據(jù)天數(shù)是否與年份有關(guān)劃分為兩類(lèi)

與年份無(wú)關(guān)的一類(lèi)中,根據(jù)每月天數(shù)的不同,又可細(xì)分為兩類(lèi)

  • 1、3、5、7、8、10、12月為1-31日
  • 4、6、9、11月為1-30日

與年份有關(guān)的一類(lèi)中

  • 平年2月為1-28日
  • 閏年2月為1-29日
  • 所有年份的所有月份都包含1-28日
  • 所有年份除2月外都包含29和30日
  • 所有年份1、3、5、7、8、10、12月都包含31日
  • 閏年2月包含29日

3.1.2  根據(jù)包含日期不同可劃分為四類(lèi)

3.1.3  分類(lèi)方法選擇

因?yàn)槿掌诜诸?lèi)之后的實(shí)現(xiàn),是要通過(guò)(exp1|exp2|exp3)這種分支結(jié)構(gòu)來(lái)實(shí)現(xiàn)的,而分支結(jié)構(gòu)是從左側(cè)分支依次向右開(kāi)始嘗試匹配,當(dāng)有一個(gè)分支匹配成功時(shí),就不再向右嘗試,否則嘗試所有分支后并報(bào)告失敗。

分支的多少,每個(gè)分支的復(fù)雜程度都會(huì)影響匹配效率,考慮到被驗(yàn)證日期概率分布,絕大多數(shù)都是落到1-28日內(nèi),所以采用第二種分類(lèi)方法,會(huì)有效提高匹配效率。

3.2     正則實(shí)現(xiàn)

采用3.1.2節(jié)的分類(lèi)方法,就可以針對(duì)每一個(gè)規(guī)則寫(xiě)出對(duì)應(yīng)的正則,以下暫按MM-dd格式進(jìn)行實(shí)現(xiàn)。

先考慮與年份無(wú)關(guān)的前三條規(guī)則,年份可統(tǒng)一寫(xiě)作

(?!0000)[0-9]{4}

下面僅考慮月和日的正則

包括平年在內(nèi)的所有年份的月份都包含1-28日

(0[1-9]|1[0-2])-(0[1-9]|1[0-9]|2[0-8])

包括平年在內(nèi)的所有年份除2月外都包含29和30日

(0[13-9]|1[0-2])-(29|30)

包括平年在內(nèi)的所有年份1、3、5、7、8、10、12月都包含31日

(0[13578]|1[02])-31)

合起來(lái)就是除閏年的2月29日外的其它所有日期

(?!0000)[0-9]{4}-((0[1-9]|1[0-2])-(0[1-9]|1[0-9]|2[0-8])|(0[13-9]|1[0-2])-(29|30)|(0[13578]|1[02])-31)

接下來(lái)考慮閏年的實(shí)現(xiàn)

閏年2月包含29日

這里的月和日是固定的,就是02-29,只有年是變化的。

可通過(guò)以下代碼輸出所有的閏年年份,考察規(guī)則

for (int i = 1; i  10000; i++){
  if ((i % 4 == 0  i % 100 != 0) || i % 400 == 0){
   richTextBox2.Text += string.Format("{0:0000}", i) + "\n";
  }
}

根據(jù)閏年的規(guī)則,很容易整理出規(guī)則,四年一閏;

([0-9]{2}(0[48]|[2468][048]|[13579][26])

百年不閏,四百年再閏。

(0[48]|[2468][048]|[13579][26])00

合起來(lái)就是所有閏年的2月29日

([0-9]{2}(0[48]|[2468][048]|[13579][26])|(0[48]|[2468][048]|[13579][26])00)-02-29)

四條規(guī)則都已實(shí)現(xiàn),且互相間沒(méi)有影響,合起來(lái)就是所有符合DateTime范圍的日期的正則

^((?!0000)[0-9]{4}-((0[1-9]|1[0-2])-(0[1-9]|1[0-9]|2[0-8])|(0[13-9]|1[0-2])-(29|30)|(0[13578]|1[02])-31)|([0-9]{2}(0[48]|[2468][048]|[13579][26])|(0[48]|[2468][048]|[13579][26])00)-02-29)$

考慮到這個(gè)正則表達(dá)式僅僅是用作驗(yàn)證,所以捕獲組沒(méi)有意義,只會(huì)占用資源,影響匹配效率,所以可以使用非捕獲組來(lái)進(jìn)行優(yōu)化。

^(?:(?!0000)[0-9]{4}-(?:(?:0[1-9]|1[0-2])-(?:0[1-9]|1[0-9]|2[0-8])|(?:0[13-9]|1[0-2])-(?:29|30)|(?:0[13578]|1[02])-31)|(?:[0-9]{2}(?:0[48]|[2468][048]|[13579][26])|(?:0[48]|[2468][048]|[13579][26])00)-02-29)$

以上正則年份0001-9999,格式y(tǒng)yyy-MM-dd??梢酝ㄟ^(guò)以下代碼驗(yàn)證正則的有效性和性能

DateTime dt = new DateTime(1, 1, 1);
DateTime endDay = new DateTime(9999, 12, 31);
Stopwatch sw = new Stopwatch();
sw.Start();
 
Regex dateRegex = new Regex(@"^(?:(?!0000)[0-9]{4}-(?:(?:0[1-9]|1[0-2])-(?:0[1-9]|1[0-9]|2[0-8])|(?:0[13-9]|1[0-2])-(?:29|30)|(?:0[13578]|1[02])-31)|(?:[0-9]{2}(?:0[48]|[2468][048]|[13579][26])|(?:0[48]|[2468][048]|[13579][26])00)-02-29)$");
 
//Regex dateRegex = new Regex(@"^((?!0000)[0-9]{4}-((0[1-9]|1[0-2])-(0[1-9]|1[0-9]|2[0-8])|(0[13-9]|1[0-2])-(29|30)|(0[13578]|1[02])-31)|([0-9]{2}(0[48]|[2468][048]|[13579][26])|(0[48]|[2468][048]|[13579][26])00)-02-29)$");
Console.WriteLine("開(kāi)始日期: " + dt.ToString("yyyy-MM-dd"));
while (dt  endDay){
  if (!dateRegex.IsMatch(dt.ToString("yyyy-MM-dd"))){
   Console.WriteLine(dt.ToString("yyyy-MM-dd") + " false");
  }
  dt = dt.AddDays(1);
}
if (!dateRegex.IsMatch(dt.ToString("yyyy-MM-dd"))){
  Console.WriteLine(dt.ToString("yyyy-MM-dd") + " false");
}
Console.WriteLine("結(jié)束日期: " + dt.ToString("yyyy-MM-dd"));
sw.Stop();
Console.WriteLine("測(cè)試用時(shí): " + sw.ElapsedMilliseconds + "ms");
Console.WriteLine("測(cè)試完成!");
Console.ReadLine();

4       日期正則表達(dá)式擴(kuò)展

4.1     “年月日”形式擴(kuò)展

  以上實(shí)現(xiàn)的是yyyy-MM-dd格式的日期驗(yàn)證,考慮到連字符的不同,以及月和日可能為M和d,即yyyy-M-d的格式,可以對(duì)以上正則進(jìn)行擴(kuò)展

^(?:(?!0000)[0-9]{4}([-/.]?)(?:(?:0?[1-9]|1[0-2])([-/.]?)(?:0?[1-9]|1[0-9]|2[0-8])|(?:0?[13-9]|1[0-2])([-/.]?)(?:29|30)|(?:0?[13578]|1[02])([-/.]?)31)|(?:[0-9]{2}(?:0[48]|[2468][048]|[13579][26])|(?:0[48]|[2468][048]|[13579][26])00)([-/.]?)0?2([-/.]?)29)$

  使用反向引用進(jìn)行簡(jiǎn)化,年份0001-9999,格式y(tǒng)yyy-MM-dd或yyyy-M-d,連字符可以沒(méi)有或是“-”、“/”、“.”之一。

^(?:(?!0000)[0-9]{4}([-/.]?)(?:(?:0?[1-9]|1[0-2])\1(?:0?[1-9]|1[0-9]|2[0-8])|(?:0?[13-9]|1[0-2])\1(?:29|30)|(?:0?[13578]|1[02])\1(?:31))|(?:[0-9]{2}(?:0[48]|[2468][048]|[13579][26])|(?:0[48]|[2468][048]|[13579][26])00)([-/.]?)0?2\2(?:29))$

  這就是“年月日”這種形式最全的一個(gè)正則了,不同含義部分以不同顏色標(biāo)識(shí),可以根據(jù)自己的需要進(jìn)行栽剪。

4.2     其它形式擴(kuò)展

  了解了以上正則各部分代表的含義,互相間的關(guān)系后,就很容易擴(kuò)展成其它格式的日期正則,如dd/MM/yyyy這種“日月年”格式的日期。

^(?:(?:(?:0?[1-9]|1[0-9]|2[0-8])([-/.]?)(?:0?[1-9]|1[0-2])|(?:29|30)([-/.]?)(?:0?[13-9]|1[0-2])|31([-/.]?)(?:0?[13578]|1[02]))([-/.]?)(?!0000)[0-9]{4}|29([-/.]?)0?2([-/.]?)(?:[0-9]{2}(?:0[48]|[2468][048]|[13579][26])|(?:0[48]|[2468][048]|[13579][26])00))$

  這種格式需要注意的就是不能用反向引用來(lái)進(jìn)行優(yōu)了。連字符等可根據(jù)自己的需求栽剪。

4.3     添加時(shí)間的擴(kuò)展

  時(shí)間的規(guī)格很明確,也很簡(jiǎn)單,基本上就HH:mm:ss和H:m:s兩種形式。

([01][0-9]|2[0-3]):[0-5][0-9]:[0-5][0-9]

  合入到日期的正則中,yyyy-MM-dd HH:mm:ss

^(?:(?!0000)[0-9]{4}-(?:(?:0[1-9]|1[0-2])-(?:0[1-9]|1[0-9]|2[0-8])|(?:0[13-9]|1[0-2])-(?:29|30)|(?:0[13578]|1[02])-31)|(?:[0-9]{2}(?:0[48]|[2468][048]|[13579][26])|(?:0[48]|[2468][048]|[13579][26])00)-02-29)\s+([01][0-9]|2[0-3]):[0-5][0-9]:[0-5][0-9]$

4.4     年份定制

  以上所有涉及到平年的年份里,使用的是0001-9999。當(dāng)然,年份也可以根據(jù)閏年規(guī)則定制。

  如年份1600-9999,格式y(tǒng)yyy-MM-dd或yyyy-M-d,連字符可以沒(méi)有或是“-”、“/”、“.”之一。

^(?:(?:1[6-9]|[2-9][0-9])[0-9]{2}([-/.]?)(?:(?:0?[1-9]|1[0-2])\1(?:0?[1-9]|1[0-9]|2[0-8])|(?:0?[13-9]|1[0-2])\1(?:29|30)|(?:0?[13578]|1[02])\1(?:31))|(?:(?:1[6-9]|[2-9][0-9])(?:0[48]|[2468][048]|[13579][26])|(?:16|[2468][048]|[3579][26])00)([-/.]?)0?2\2(?:29))$

5       特別說(shuō)明

  以上正則采用的是最基本的正則語(yǔ)法規(guī)則,絕大多數(shù)采用傳統(tǒng)NFA引擎的語(yǔ)言都可以支持,包括JavaScript、Java、.NET等。

  另外需求說(shuō)明的是,雖然日期的規(guī)則相對(duì)明確,可以采用這種方式裁剪來(lái)得到符合要求的日期正則,但是并不推薦這樣使用正則,正則的強(qiáng)大在于它的靈活性,可以根據(jù)需求,量身打造最合適的正則,如果只是用來(lái)套用模板,那正則也就不稱(chēng)其為正則了。

  正則的語(yǔ)法規(guī)則并不多,而且很容易入門(mén),掌握語(yǔ)法規(guī)則,量體裁衣,才是正則之“道”。

6       應(yīng)用

一、首先看需求

  日期的輸入:

  手動(dòng)輸入,可輸入兩種格式y(tǒng)yyymmdd或yyyy-mm-dd

二、解決思路

用戶(hù)手動(dòng)輸入日期,需要驗(yàn)證輸入的日期格式

用戶(hù)可能的輸入情況可以分為以下幾種:

(1).輸入為空或者為空格

(2).輸入非日期格式

  根據(jù)保存到數(shù)據(jù)庫(kù)中的日期格式,保存的格式為yyyy-mm-dd,所以用戶(hù)在輸入yyyymmdd后需要進(jìn)行轉(zhuǎn)換,轉(zhuǎn)換成yyyy-mm-dd。

  思路:

  驗(yàn)證日期格式,首現(xiàn)想到的是VS的驗(yàn)證控件,但是因?yàn)樾枰?yàn)證的控件有幾十個(gè),使用驗(yàn)證控件就需要一個(gè)個(gè)的拉控件,如果后期需要修改也很麻煩,而通過(guò)JS實(shí)現(xiàn)控制,再通過(guò)正則表達(dá)式對(duì)日期進(jìn)行驗(yàn)證。

三、JS實(shí)現(xiàn)

//驗(yàn)證日期
function date(id) {
  var idvalue = document.getElementById(id).value;  //通過(guò)查找元素
  var tmpStr = "";
  var strReturn = "";
  //調(diào)用trim()去掉空格,因?yàn)閖s不支持trim()
  var iIdNo = trim(idvalue);
  //正則表達(dá)式,判斷日期格式,包括日期的界限,日期的格式,平年和閏年
  var v = idvalue.match(/^((((1[6-9]|[2-9]\d)\d{2})-(0?[13578]|1[02])-(0?[1-9]|[12]\d|3[01]))|(((1[6-9]|[2-9]\d)\d{2})-(0?[13456789]|1[012])-(0?[1-9]|[12]\d|30))|(((1[6-9]|[2-9]\d)\d{2})-0?2-(0?[1-9]|1\d|2[0-8]))|(((1[6-9]|[2-9]\d)(0[48]|[2468][048]|[13579][26])|((16|[2468][048]|[3579][26])00))-0?2-29-))$/);
  //輸入為空時(shí)跳過(guò)檢測(cè)
  if (iIdNo.length == 0) {
    return false;
  }
  //自動(dòng)更改日期格式為yyyy-mm-dd
  if (iIdNo.length == 8) {
    tmpStr = iIdNo.substring(0, 8);
    tmpStr = tmpStr.substring(0, 4) + "-" + tmpStr.substring(4, 6) + "-" + tmpStr.substring(6, 8)
    document.getElementById(id).value = tmpStr;
    document.getElementById(id).focus();
  }
  //驗(yàn)證,判斷日期格式
  if ((iIdNo.length != 8)  !v) {
    strReturn = "日期格式錯(cuò)誤,提示:19990101或1999-01-01";
    alert(strReturn);
    document.getElementById(id).select();
    return false;
  }
}
//運(yùn)用正則表達(dá)式去除字符串兩端空格(因?yàn)閖s不支持trim()) 
function trim(str) {
  return str.replace(/(^\s*)|(\s*$)/g, "");
}
//前臺(tái)調(diào)用(獲得焦點(diǎn)觸發(fā))
input class="txtenterschooldate" size="14" type="text" id="txtenterschooldate" name="txtenterschooldate" onblur="date('txtenterschooldate')"/>

總結(jié)

以上所述是小編給大家介紹的關(guān)于日期正則表達(dá)式的思路詳解,希望對(duì)大家有所幫助,如果大家有任何疑問(wèn)請(qǐng)給我留言,小編會(huì)及時(shí)回復(fù)大家的。在此也非常感謝大家對(duì)腳本之家網(wǎng)站的支持!

您可能感興趣的文章:
  • 最常用的15個(gè)前端表單驗(yàn)證JS正則表達(dá)式
  • JS使用正則表達(dá)式驗(yàn)證身份證號(hào)碼
  • 用戶(hù)名、密碼等15個(gè)常用的js正則表達(dá)式
  • JS匹配日期和時(shí)間的正則表達(dá)式示例
  • C#正則表達(dá)式判斷輸入日期格式是否正確
  • 正則表達(dá)式實(shí)現(xiàn)將MM/DD/YYYY格式的日期轉(zhuǎn)換為YYYY-MM-DD格式
  • 匹配yyyy-mm-dd日期格式的的正則表達(dá)式
  • js:日期正則表達(dá)式及檢測(cè)
  • JavaScript分步實(shí)現(xiàn)一個(gè)出生日期的正則表達(dá)式

標(biāo)簽:常州 本溪 涼山 大興安嶺 泰安 湖州 哈密

巨人網(wǎng)絡(luò)通訊聲明:本文標(biāo)題《關(guān)于日期正則表達(dá)式的思路詳解》,本文關(guān)鍵詞  關(guān)于,日期,正則,表達(dá)式,;如發(fā)現(xiàn)本文內(nèi)容存在版權(quán)問(wèn)題,煩請(qǐng)?zhí)峁┫嚓P(guān)信息告之我們,我們將及時(shí)溝通與處理。本站內(nèi)容系統(tǒng)采集于網(wǎng)絡(luò),涉及言論、版權(quán)與本站無(wú)關(guān)。
  • 相關(guān)文章
  • 下面列出與本文章《關(guān)于日期正則表達(dá)式的思路詳解》相關(guān)的同類(lèi)信息!
  • 本頁(yè)收集關(guān)于關(guān)于日期正則表達(dá)式的思路詳解的相關(guān)信息資訊供網(wǎng)民參考!
  • 推薦文章