JavaScript数据结构——字典和散列表的实现

  • 时间:
  • 浏览:0
  • 来源:幸运快3_快3开奖_幸运快3开奖

  在前一篇文章中,当让我们当让我们 儿介绍了怎样才能在JavaScript中实现集合。字典和集合的主要区别就在于,集合中数据是以[值,值]的形式保存的,当让我们当让我们 儿只关心值五种;而在字典和散列表中数据是以[键,值]的形式保存的,键那末 重复,当让我们当让我们 儿不仅关心键,也关心键所对应的值。

  当让我们当让我们 儿也还不还都还可以 把字典称之为映射表。不可能 字典和集合很这类,当让我们当让我们 儿还不还都还可以 在前一篇文章中的集合类Set的基础上来实现当让我们当让我们 儿的字典类Dictionary。与Set类这类,ES6的原生Map类不可能 实现了字典的全部功能,稍后当让我们当让我们 儿会介绍它的用法。

  下面是当让我们当让我们 儿的Dictionary字典类的实现代码:

class Dictionary {
    constructor () {
        this.items = {};
    }

    set (key, value) { // 向字典中加进去去或修改元素
        this.items[key] = value;
    }

    get (key) { // 通过键值查找字典中的值
        return this.items[key];
    }

    delete (key) { // 通过使用键值来从字典中删除对应的元素
        if (this.has(key)) {
            delete this.items[key];
            return true;
        }
        return false;
    }

    has (key) { // 判断给定的键值与否处于于字典中
        return this.items.hasOwnProperty(key);
    }

    clear() { // 清空字典内容
        this.items = {};
    }

    size () { // 返回字典中所有元素的数量
        return Object.keys(this.items).length;
    }

    keys () { // 返回字典中所有的键值
        return Object.keys(this.items);
    }

    values () { // 返回字典中所有的值
        return Object.values(this.items);
    }

    getItems () { // 返回字典中的所有元素
        return this.items;
    }
}

  与Set类很这类,只是把其中value的帕累托图替加进去了key。当让我们当让我们 儿来看看因此 测试用例:

let Dictionary = require('./dictionary');

let dictionary = new Dictionary();
dictionary.set('Gandalf', 'gandalf@email.com');
dictionary.set('John', 'john@email.com');
dictionary.set('Tyrion', 'tyrion@email.com');
console.log(dictionary.has('Gandalf')); // true
console.log(dictionary.size()); // 3
console.log(dictionary.keys()); // [ 'Gandalf', 'John', 'Tyrion' ]
console.log(dictionary.values()); // [ 'gandalf@email.com', 'john@email.com', 'tyrion@email.com' ]
console.log(dictionary.get('Tyrion')); // tyrion@email.com

dictionary.delete('John');
console.log(dictionary.keys()); // [ 'Gandalf', 'Tyrion' ]
console.log(dictionary.values()); // [ 'gandalf@email.com', 'tyrion@email.com' ]
console.log(dictionary.getItems()); // { Gandalf: 'gandalf@email.com', Tyrion: 'tyrion@email.com' }

  相应地,下面是使用ES6的原生Map类的测试结果:

let dictionary = new Map();
dictionary.set('Gandalf', 'gandalf@email.com');
dictionary.set('John', 'john@email.com');
dictionary.set('Tyrion', 'tyrion@email.com');
console.log(dictionary.has('Gandalf')); // true
console.log(dictionary.size); // 3
console.log(dictionary.keys()); // [Map Iterator] { 'Gandalf', 'John', 'Tyrion' }
console.log(dictionary.values()); // [Map Iterator] { 'gandalf@email.com', 'john@email.com', 'tyrion@email.com' }
console.log(dictionary.get('Tyrion')); // tyrion@email.com

dictionary.delete('John');
console.log(dictionary.keys()); // [Map Iterator] { 'Gandalf', 'Tyrion' }
console.log(dictionary.values()); // [Map Iterator] { 'gandalf@email.com', 'tyrion@email.com' }
console.log(dictionary.entries()); // [Map Iterator] { [ Gandalf: 'gandalf@email.com' ], [ Tyrion: 'tyrion@email.com' ] }

  和前面当让我们当让我们 儿自定义的Dictionary类稍微有因此 不同,values()辦法 和keys()辦法 返回的不还都还可以 另一一二个数组,只是Iterator迭代器。原先只是这里的size是另一一二个属性而不还都还可以 辦法 ,只是只是Map类那末 getItems()辦法 ,取而代之的是entries()辦法 ,它返回的也是另一一二个Iterator。有关Map类的全部全部介绍还不还都还可以 查看这里。

  在ES6中,除了原生的Set和Map类外,还有它们的弱化版本,分别是WeakSet和WeakMap,当让我们当让我们 儿在《JavaScript数据内外部——栈的实现与应用》一文中不可能 见过WeakMap的使用了。Map和Set与它们其他人的弱化版本之间的主要区别是:

  • WeakSet或WeakMap类那末 entries、keys和values等迭代器辦法 ,那末 通过get和set辦法 访问和设置其中的值。这也是为那先 当让我们当让我们 儿在《JavaScript数据内外部——栈的实现与应用》一文中要使用WeakMap类来定义类的私有属性的原困。
  • 那末 用对应作为键值,不可能 说其中的内容那末 是对象,而那末 是数字、字符串、布尔值等基本数据类型。

  弱化的Map和Set类主只是为了提供JavaScript代码的性能。

散列表

  散列表(不可能 叫哈希表),是五种改进的dictionary,它将key通过另一一二个固定的算法(散列函数或哈希函数)得出另一一二个数字,只是将dictionary中key所对应的value存中放这个 数字所对应的数组下标所含有的存储空间中。在原始的dictionary中,不可能 要查找某个key所对应的value,当让我们当让我们 儿不还都还可以 遍历整个字典。为了提高查询的强度,当让我们当让我们 儿将key对应的value保存到数组里,假如key不变,使用相同的散列函数计算出来的数字只是固定的,于是就还不还都还可以 调慢地在数组中找到你随后查找的value。下面是散列表的数据内外部示意图:

  下面是当让我们当让我们 儿散列函数loseloseHashCode()的实现代码:

loseloseHashCode (key) {
    let hash = 0;
    for (let i = 0; i < key.length; i++) {
        hash += key.charCodeAt(i);
    }
    return hash % 37;
}

  这个 散列函数的实现很简单,当让我们当让我们 儿将传入的key中的每另一一二个字符使用charCodeAt()函数(有关该函数的全部内容还不还都还可以 查看这里)将其转加进去ASCII码,只是将那先 ASCII码相加,最后用37求余,得到另一一二个数字,这个 数字只是这个 key所对应的hash值。接下来要做的只是将value存中放hash值所对应的数组的存储空间内。下面是当让我们当让我们 儿的HashTable类的主要实现代码:

class HashTable {
    constructor () {
        this.table = [];
    }

    loseloseHashCode (key) { // 散列函数
        let hash = 0;
        for (let i = 0; i < key.length; i++) {
            hash += key.charCodeAt(i);
        }
        return hash % 37;
    }

    put (key, value) { // 将键值对存中放哈希表中
        let position = this.loseloseHashCode(key);
        console.log(`${position} - ${key}`);
        this.table[position] = value;
    }

    get (key) { // 通过key查找哈希表中的值
        return this.table[this.loseloseHashCode(key)];
    }

    remove (key) { // 通过key从哈希表中删除对应的值
        this.table[this.loseloseHashCode(key)] = undefined;
    }

    isEmpty () { // 判断哈希表与否为空
        return this.size() === 0;
    }

    size () { // 返回哈希表的长度
        let count = 0;
        this.table.forEach(item => {
            if (item !== undefined) count++;
        });
        return count;
    }

    clear () { // 清空哈希表
        this.table = [];
    }
}

  测试一下上方的那先 辦法 :

let HashTable = require('./hashtable');

let hash = new HashTable();
hash.put('Gandalf', 'gandalf@email.com'); // 19 - Gandalf
hash.put('John', 'john@email.com'); // 29 - John
hash.put('Tyrion', 'tyrion@email.com'); // 16 - Tyrion

console.log(hash.isEmpty()); // false
console.log(hash.size()); // 3
console.log(hash.get('Gandalf')); // gandalf@email.com
console.log(hash.get('Loiane')); // undefined

hash.remove('Gandalf');
console.log(hash.get('Gandalf')); // undefined
hash.clear();
console.log(hash.size()); // 0
console.log(hash.isEmpty()); // true

  为了方便查看hash值和value的对应关系,当让我们当让我们 儿在put()辦法 中加入了一行console.log(),用来打印key的hash值和value之间的对应关系。还不还都还可以 看一遍,测试的结果和前面当让我们当让我们 儿给出的示意图是一致的。

  散列集合的实现和散列表这类,只不过在散列集合中不再使用键值对,只是那末 值那末 键。这个 当让我们当让我们 儿在前面介绍集合和字典的刚刚 不可能 讲过了,这里不再赘述。

  细心的同学不可能 不可能 发现了,这里当让我们当让我们 儿提供的散列函数不可能 过于简单,以致于当让我们当让我们 儿无法保证通过散列函数计算出来的hash值一定是唯一的。换句话说,传入不同的key值,当让我们当让我们 儿有不可能 会得到相同的hash值。尝试一下下面那先 keys:

let hash = new HashTable();
hash.put('Gandalf', 'gandalf@email.com');
hash.put('John', 'john@email.com');
hash.put('Tyrion', 'tyrion@email.com');
hash.put('Aaron', 'aaron@email.com');
hash.put('Donnie', 'donnie@email.com');
hash.put('Ana', 'ana@email.com');
hash.put('Jamie', 'jamie@email.com');
hash.put('Sue', 'sue@email.com');
hash.put('Mindy', 'mindy@email.com');
hash.put('Paul', 'paul@email.com');
hash.put('Nathan', 'nathan@email.com');

  从结果中还不还都还可以 看一遍,尽管因此 keys不同,只是通过当让我们当让我们 儿提供的散列函数你造得到了相同的hash值,这显然违背了当让我们当让我们 儿的设计原则。在哈希表中,这个 叫做散列冲突,为了得到另一一二个可靠的哈希表,当让我们当让我们 儿不还都还可以 尽不可能 地处理散列冲突。那怎样才能处理这个 冲突呢?这里介绍五种处理冲突的辦法 :分离链接和线性探查。

分离链接

   所谓分离链接,只是将原先存储在哈希表中的值改成链表,原先在哈希表的同另一一二个位置上,就还不还都还可以 存储多个不同的值。链表中的每另一一二个元素,同時 存储了key和value。示意图如下:

  原先,当不同的key通过散列函数计算出相同的hash值时,当让我们当让我们 儿只不还都还可以 找到数组中对应的位置,只是往其中的链表加进去去新的节点即可,从而有效地处理了散列冲突。为了实现这个 数据内外部,当让我们当让我们 儿不还都还可以 定义另一一二个新的辅助类ValuePair,它的内容如下:

let ValuePair = function (key, value) {
  this.key = key;
  this.value = value;

  this.toString = function () { // 提供toString()辦法

以方便当让我们当让我们

儿测试
      return `[${this.key} - ${this.value}]`;
  }
};

  ValuePair类具有另一一二个属性,key和value,用来保存当让我们当让我们 儿要存入到散列表中的元素的键值对。toString()辦法 在这里不还都还可以 不还都还可以 的,该辦法 是为了上方当让我们当让我们 儿方便测试。

  新的采用了分离链接的HashTableSeparateChaining类还不还都还可以 继承自前面的HashTable类,全部的代码如下:

class HashTableSeparateChaining extends HashTable {
    constructor () {
        super();
    }

    put (key, value) {
        let position = this.loseloseHashCode(key);

        if (this.table[position] === undefined) {
            this.table[position] = new LinkedList(); // 单向链表,不还都还可以

引入LinkedList类
        }
        this.table[position].append(new ValuePair(key, value));
    }

    get (key) {
        let position = this.loseloseHashCode(key);

        if (this.table[position] !== undefined) {
            let current = this.table[position].getHead();
            while (current) {
                if (current.element.key === key) return current.element.value;
                current = current.next;
            }
        }
        return undefined;
    }

    remove (key) {
        let position = this.loseloseHashCode(key);
        let hash = this.table[position];

        if (hash !== undefined) {
            let current = hash.getHead();
            while (current) {
                if (current.element.key === key) {
                    hash.remove(current.element);
                    if (hash.isEmpty()) this.table[position] = undefined;
                    return true;
                }
                current = current.next;
            }
        }

        return false;
    }

    size () {
        let count = 0;
        this.table.forEach(item => {
            if (item !== undefined) count += item.size();
        });
        return count;
    }

    toString() {
        let objString = "";
        for (let i = 0; i < this.table.length; i++) {
            let ci = this.table[i];
            if (ci === undefined) continue;

            objString += `${i}: `;
            let current = ci.getHead();
            while (current) {
                objString += current.element.toString();
                current = current.next;
                if (current) objString += ', ';
            }
            objString += '\r\n';
        }
        return objString;
    }
}

  其中的LinkedList类为单向链表,具体内容还不还都还可以 查看《JavaScript数据内外部——链表的实现与应用》。注意,现在hash数组中的每另一一二个元素不还都还可以 另一一二个单向链表,单向链表的所有操作当让我们当让我们 儿还不还都还可以 借利于LinkedList类来完成。当让我们当让我们 儿重写了size()辦法 ,不可能 现在要计算的是数组中所有链表的长度总和。

  下面是HashTableSeparateChaining类的测试用例及结果:

let hash = new HashTableSeparateChaining();

hash.put('Gandalf', 'gandalf@email.com');
hash.put('John', 'john@email.com');
hash.put('Tyrion', 'tyrion@email.com');
hash.put('Aaron', 'aaron@email.com');
hash.put('Donnie', 'donnie@email.com');
hash.put('Ana', 'ana@email.com');
hash.put('Jamie', 'jamie@email.com');
hash.put('Sue', 'sue@email.com');
hash.put('Mindy', 'mindy@email.com');
hash.put('Paul', 'paul@email.com');
hash.put('Nathan', 'nathan@email.com');

console.log(hash.toString());
console.log(`size: ${hash.size()}`);
console.log(hash.get('John'));

console.log(hash.remove('Ana'));
console.log(hash.remove('John'));
console.log(hash.toString());

  还不还都还可以 看一遍,结果和上方示意图上给出的是一致的,size()、remove()和get()辦法 的执行结果也符合预期。

线性探查

  处理散列冲突的另五种辦法 是线性探查。当向哈希数组中加进去去某另一一二个新元素时,不可能 该位置上不可能 有数据了,就继续尝试下另一一二个位置,直到对应的位置上那末 数据时,就在该位置加进去去进去数据。当让我们当让我们 儿将上方的例子改成线性探查的辦法 ,存储结果如下图所示:

  现在当让我们当让我们 儿不要再还都还可以 单向链表LinkedList类了,只是ValuePair类仍然是不还都还可以 的。同样的,当让我们当让我们 儿的HashTableLinearProbing类继承自HashTable类,全部的代码如下:

class HashTableLinearProbing extends HashTable {
    constructor () {
        super();
    }

    put (key, value) {
        let position = this.loseloseHashCode(key);

        if (this.table[position] === undefined) {
            this.table[position] = new ValuePair(key, value);
        }
        else {
            let index = position + 1;
            while (this.table[index] !== undefined) {
                index ++;
            }
            this.table[index] = new ValuePair(key, value);
        }
    }

    get (key) {
        let position = this.loseloseHashCode(key);

        if (this.table[position] !== undefined) {
            if (this.table[position].key === key) return this.table[position].value;
            let index = position + 1;
            while (this.table[index] !== undefined && this.table[index].key === key) {
                index ++;
            }
            return this.table[index].value;
        }
        return undefined;
    }

    remove (key) {
        let position = this.loseloseHashCode(key);

        if (this.table[position] !== undefined) {
            if (this.table[position].key === key) {
                this.table[position] = undefined;
                return true;
            }
            let index = position + 1;
            while (this.table[index] !== undefined && this.table[index].key !== key) {
                index ++;
            }
            this.table[index] = undefined;
            return true;
        }
        return false;
    }

    toString() {
        let objString = "";
        for (let i = 0; i < this.table.length; i++) {
            let ci = this.table[i];
            if (ci === undefined) continue;

            objString += `${i}: ${ci}\r\n`;
        }
        return objString;
    }
}

  使用上方和HashTableSeparateChaining类相同的测试用例,当让我们当让我们 儿来看看测试结果:

  还不还都还可以 和HashTableSeparateChaining类的测试结果比较一下,多出来的位置6、14、17、33,正是HashTableSeparateChaining类中每另一一二个链表的剩余帕累托图。get()和remove()辦法 不还都还可以正常工作,当让我们当让我们 儿不要再还都还可以 重写size()辦法 ,和基类HashTable中一样,hash数组中每另一一二个位置只保存了另一一二个元素。原先要注意的地方是,不可能 JavaScript中定义数组时不要再还都还可以 提前给出数组的长度,只是当让我们当让我们 儿还不还都还可以 很容易地利用JavaScript语言的这个 内外部来实现线性探查。在因此 编程语言中,数组的定义是不还都还可以 明确给出长度的,这时当让我们当让我们 儿就不还都还可以 重新考虑当让我们当让我们 儿的HashLinearProbing类的实现了。

  loseloseHashCode()散列函数并不还都还可以 另一一二个表现良好的散列函数,正如你所看一遍的,它会很轻易地产生散列冲突。另一一二个表现良好的散列函数不还都还可以 不要再还都还可以尽不可能 低地减少散列冲突,并提高性能。当让我们当让我们 儿还不还都还可以 在网上找因此 不同的散列函数的实现辦法 ,下面是另一一二个比loseloseHashCode()更好的散列函数djb2HashCode():

djb2HashCode (key) {
    let hash = 5381;
    for (let i = 0; i < key.length; i++) {
        hash = hash * 33 + key.charCodeAt(i);
    }
    return hash % 1013;
}

  当让我们当让我们 儿用相同的测试用例来测试dj2HashCode(),下面是测试结果:

  这次那末 冲突!然而这并不还都还可以 最好的散列函数,但它是社区最推崇的散列函数之一。

  下一章当让我们当让我们 儿将介绍怎样才能用JavaScript来实现树。