要解决的问题

用户在上传海量图片的时候,我们希望提供能够根据图片文件名进行正序/逆序排序的功能。

但是,传统的localeCompare方法,在面对包含数字和字符的字符串数组的排序时,会遇到如下问题:

1
var source = ['0509_1.jpg', '0509_2.jpg', '0509_11.jpg']

经过localeCompare()排序后,会变成

1
var result = ['0509_1.jpg', '0509_11.jpg', '0509_2.jpg']

显然这不是我们想要的结果

natsort库分析

幸运地,我们在github上找到一个成熟的排序库natsort

该算法中,最重要的就在于正则表达式的构建,才能准确地将数字从字符串中识别并分离出来。

下面我们分析一下它的源码,一起学习一下如何正确地比较两个字符串的大小。

Step1: 去掉空格

1
2
3
4
5
var tre = /^\s+|\s+$/g

function replaceWhiteSpace (s) {
return ('' + s).replace(tre, '');
}

Step2: 将包含的数字部分进行拆分

1
2
3
4
5
6
7
8
var nre = /(0x[\da-fA-F]+|(^[\+\-]?\d+(?:\.\d*)?(?:[eE][+\-]?\d+)?(?=\D|\s|$))|\d+)/g

function splitString (s) {
return s.replace(nre, '\0$1\0')
.replace(/\0$/, '')
.replace(/^\0/, '')
.split('\0')
}

Step3: 判断是否为Hex或者日期

1
2
3
4
5
6
7
8
9
10
11
var hre = /^0x[0-9a-f]+$/i

function parseHex (s) {
return parseInt(s.match(hre), 16) || null
}

var dre = /(^([\w ]+,?[\w ]+)?[\w ]+,?[\w ]+\d+:\d+(:\d+)?[\w ]?|^\d{1,4}[\/\-]\d{1,4}[\/\-]\d{1,4}|^\w+, \w+ \d+, \d{4})/

function parseDatetime (s) {
return s.match(dre) && Date.parse(s) || null
}

Step4: 对已拆分的两个数组进行比较

代码就不贴出来了,大概的思路就是:

  1. 遍历两个数组,对其中的数字转换为字符串;
  2. 对转换出来的字符串使用localeCompare进行比较;

用法

参见natsort