从零实现一个Sass预处理器

一、Sass预处理器简介

Sass 是一款强化 CSS 的辅助工具，它在 CSS 语法的基础上增加了变量 (variables)、嵌套 (nested rules)、混合 (mixins)、导入 (inline imports) 等高级功能，这些拓展令 CSS 更加强大与优雅。使用 Sass 以及 Sass 的样式库（如 Compass）有助于更好地组织管理样式文件，以及更高效地开发项目。

// index.scss sass源码
$redColor: red;
$yellowBg: yellow;
nav {
    height: 100px;
    border: 1px solid $redColor;
}
#content {
    height: 300px;
    p {
        margin: 10px;
        .selected {
            backgournd: $yellowBg;
        }
    }
}

经过sass编译后，生成的代码结果如下:

// sass编译后的输出的css代码
nav {
  height: 100px;
  border: 1px solid red; }

#content {
  height: 300px; }
  #content p {
    margin: 10px; }
    #content p .selected {
      backgournd: yellow; }

接下来我们将实现一个简单的Sass预处理，其基本功能包括:

能够解析变量
能够使用嵌套

二、编译器简介

Sass预处理器本质是一个编译器，Sass的源文件是.scss文件，里面的内容包含了Sass自己的语法，是无法直接执行的，必须经过编译转换为.css文件后才能执行，其编译过程就是：

读取sass源码，然后对sass源码进行词法分析，生成一个一个的token；

然后对这些token进行语法分析，生成抽象语法树（Abstract Syntax Tree，AST），解析成抽象语法树后，就可以很方便的拿到我们需要的数据并进行相应的处理；

然后遍历抽象语法树，对抽象语法树进行转换，转换成我们需要的代码输出结构，方便输出最终代码，比如，因为Sass源码采用了嵌套，所以我们需要将选择器变回链式结构；

虽然对抽象语法树进行了相应的转换，但是转换后的结果仍然是对象的形式，所以我们还需要进行代码的生成，将对象形式转换为字符串形式输出。

三、实现Sass预处理器

① 词法分析
词法分析就是要找出源码中包含的token，这个token也是一个对象，其中包含所属的类型type、对应的值value(词在源码中对应的字符串内容)、当前token在源码中的缩进值indent。其中type类型有变量定义、变量引用、选择器、属性、值。

{
    type: "variableDef" | "variableRef" | "selector" | "property" | "value", // 当前词所属类型
    value: string, // Sass源码中对应的字符串内容
    indent: number // 当前词在Sass源码中的缩进值
}

对Sass源码字符串进行以换行符进行分割，分割成数组，每一行的内容作为数组中的一个元素

const sassSourceCode = `

`; // Sass的源码
// 对Sass源码以换行符进行分割
const lines = sassSourceCode.trim().split(/\n/);

拿到每一行的内容后，需要对每一行的内容进行遍历，拿到每一行内容前面的空格数，即缩进，接着对每一行的内容以冒号进行分割，分割成数组，将每一行中的词(word)作为数组的一个元素

// 遍历每一行中的内容，将生成的token放到tokens数组中，最初为[]
lines.reduce((tokens, line) => {
    const spaces = line.match(/^\s+/) || [""]; // 匹配每行开头的空格部分
    const indent = spaces[0].length; // 拿到每行的缩进空格数量
    const input = line.trim(); // 去除首尾空格
    let words = input.split(/:/); // 用冒号进行分割，拿到每一行中的所有词
}, []);

拿到每一行中包含的词后，我们就可以对每一个词进行处理了，通过查看上面的Sass源码，可以看到，每一行以冒号分割后，如果是选择器，如#content {，那么分割后的words数组中只有一个元素，我们可以以此找到选择器，如:

let firstWord = words.shift(); // 取出并删除每行的第一个词
const selectorReg = /([0-9a-zA-Z-.#\[\]]+)\s+\{$/; // 选择器匹配正则
if (words.length === 0) { // 如果取出并删除第一个词后，words数组长度变为为0，说明该行只有一个词，那么这个词就是选择器
    const result = firstWord.match(selectorReg); // 有可能是 }，冒号分割后words的长度也会变成0，所以需要进行正则匹配
    if (result) {
        tokens.push({ // 将选择器放到tokens中
            type: "selector",
            value: result[1],
            indent
        });
    }
}

接下来就是处理变量定义、属性、变量引用、值这些类型了，如果当前行的第一个词是以美元符开头，那么这个词就是变量定义，否则就是属性，因为值和变量引用不可能是第一个词，而是在第一个词之后。

if (words.length === 0) {

} else { // 变量定义、属性、变量引用、值
    let type = "";
    if (/^\$/.test(firstWord)) { // 如果每行的第一个词是以$开头的，那么这个词就是一个变量定义
        type = "variableDef"; // 那么type就是变量定义，即variableDef
    } else {
        type = "property";
    }
    tokens.push({ // 将变量定义或者属性放到tokens中
        type,
        value: firstWord,
        indent
    });
}

至此，第一个词已经处理完毕，接着开始处理之后的词了，剩下的词要么是值要么是变量引用，并且有些词比较特殊，如 1px solid red，其中包含了3个值，所以需要用空格进行分割成数组分成3个词处理，如:

// 继续取出words中剩余的词进行分析，剩下的词可能是值或者是变量引用两种类型
while (firstWord = words.shift()) { // 取出下一个词更新firstWord
    firstWord = firstWord.trim(); // 去除词的首尾空格
    const values = firstWord.split(/\s/); // 有些词(1px solid red)可能包含多个值，所以需要用空格进行分割, 拿到所有的值
    if (values.length > 1) { // 如果值有多个
        words = values; // 将所有的值作为words继续遍历
        continue;
    }
    firstWord = firstWord.replace(/;/, ""); // 去除值中包含的分号
    tokens.push({ // 将值或者变量引用加入到tokens中
        type: /^\$/.test(firstWord) ? "variableRef" : "value",
        value: firstWord,
        indent: 0
    });
}

经过一层一层遍历，源码中的所有词都被解析成了token并且放到了tokens数组中，完整代码如下:

/*
* 将Sass源码传入进行词法分析生成tokens数组
*/
function tokenize(sassSourceCode) {
    return sassSourceCode.trim().split(/\n/).reduce((tokens, line) => {
        const spaces = line.match(/^\s+/) || [""]; // 匹配空格开头的行
        const indent = spaces[0].length; // 拿到每行的缩进空格数量
        const input = line.trim(); // 去除首尾空格
        let words = input.split(/:/); // 用冒号进行分割，拿到每一行中的所有词
        let firstWord = words.shift(); // 取出并删除每行的第一个词
        const selectorReg = /([0-9a-zA-Z-.#\[\]]+)\s+\{$/;
        if (words.length === 0) { // 如果取出并删除第一个词后，words数组长度变为为0，说明该行只有一个词，那么这个词就是选择器
            const result = firstWord.match(selectorReg);
            if (result) {
                tokens.push({ // 将选择器放到tokens中
                    type: "selector",
                    value: result[1],
                    indent
                });
            }
        } else { // 变量定义、变量引用、属性、值
            let type = "";
            if (/^\$/.test(firstWord)) { // 如果每行的第一个词是以$开头的，那么这个词就是一个变量定义
                type = "variableDef"; // 那么type就是变量定义，即variableDef
            } else { // 如果每行的第一个次是非美元符开头，那么就是属性
                type = "property";
            }
            tokens.push({ // 将变量定义或者属性放到tokens中
                type,
                value: firstWord,
                indent
            });
            // 继续取出words中剩余的词进行分析，剩下的词可能是值或者是变量引用两种类型
            while (firstWord = words.shift()) {
                firstWord = firstWord.trim(); // 去除词的首尾空格
                const values = firstWord.split(/\s/); // 有些词(1px solid red)可能包含多个值，所以需要用空格进行分割, 拿到所有的值
                if (values.length > 1) { // 如果值有多个
                    words = values; // 将所有的值作为words继续遍历
                    continue;
                }
                firstWord = firstWord.replace(/;/, ""); // 去除值中包含的分号
                tokens.push({ // 将值或者变量引用加入到tokens中
                    type: /^\$/.test(firstWord) ? "variableRef" : "value",
                    value: firstWord,
                    indent: 0
                });
            }
        }
        return tokens;
    }, []);
}

用上面的源码测试一下词法分析的结果如下:

[ { type: 'variableDef', value: '$redColor', indent: 0 },
  { type: 'value', value: 'red', indent: 0 },
  { type: 'variableDef', value: '$yellowBg', indent: 0 },
  { type: 'value', value: 'yellow', indent: 0 },
  { type: 'selector', value: 'nav', indent: 0 },
  { type: 'property', value: 'height', indent: 4 },
  { type: 'value', value: '100px', indent: 0 },
  { type: 'property', value: 'border', indent: 4 },
  { type: 'value', value: '1px', indent: 0 },
  { type: 'value', value: 'solid', indent: 0 },
  { type: 'variableRef', value: '$redColor', indent: 0 },
  { type: 'selector', value: '#content', indent: 0 },
  { type: 'property', value: 'height', indent: 4 },
  { type: 'value', value: '300px', indent: 0 },
  { type: 'selector', value: 'p', indent: 4 },
  { type: 'property', value: 'margin', indent: 8 },
  { type: 'value', value: '10px', indent: 0 },
  { type: 'selector', value: '.selected', indent: 8 },
  { type: 'property', value: 'backgournd', indent: 12 },
  { type: 'variableRef', value: '$yellowBg', indent: 0 } ]

② 语法分析
语法分析就是对tokens进行遍历，将其解析成一个树形结构。整个树有一个根节点，根节点下有children子节点数组，只有选择器类型才能成为一个节点，并且每一个节点下有一个rules属性用于存放当前节点的样式规则，根节点如下:

const ast = { // 定义一个抽象语法树AST对象，一开始只有根节点
    type: "root", // 根节点
    value: "root",
    children: [],
    rules: [],
    indent: -1
};

每一条规则也是一个对象，结构如下:

// 样式规则
{ 
    property: "border",
    value: ["1px", "solid", "red"],
    indent: 8
}

解析前，首先初始化一个root根节点，和解析路径，用于定位样式所属的节点，接着准备按顺序遍历每一个token，如:

function parse(tokens) {
    const ast = { // 定义一个抽象语法树AST对象
        type: "root", // 根节点
        value: "root",
        children: [],
        rules: [],
        indent: -1
    };
    const path = [ast]; // 将抽象语法树对象放到数组中，即当前解析路径，最后一个元素为父元素
    let parentNode = ast; // 将当前根节点作为父节点
    // 遍历所有的token
    while (token = tokens.shift()) {
    }
    return ast;
}

首先处理变量的定义，如果该token的类型是variableDef，并且它的下一个token的类型是value，那么就是变量的定义，将变量的名称和值保存到变量字典中，以便后面变量引用的时候可以从变量字典中读取变量的值，如:

const variableDict = {}; // 保存定义的变量字典
while (token = tokens.shift()) {
    if (token.type === "variableDef") { // 如果这个token是变量定义
        if (tokens[0] && tokens[0].type === "value") { // 并且如果其下一个token的类型是值定义，那么这两个token就是变量的定义
            const variableValueToken = tokens.shift(); // 取出包含变量值的token
            variableDict[token.value] = variableValueToken.value; // 将变量名和遍历值放到vDict对象中
        }
        continue;
    }
}

接着处理类型为selector的token，对于selector选择器类型，我们需要创建一个新节点，然后和当前父节点的缩进值进行比较，如果当前创建的新节点的缩进值比当前父节点大，说明是当前父节点的子节点，直接将当前创建的新节点push到父节点的children数组中，并且更新当前创建的新节点为父节点。如果当前创建的新节点的缩进值比当前父节点小，说明不是当前父节点的子节点，那么我们就需要从当前解析路径中逐个取出最后一个节点，直到找到当前创建节点的父节点，即找到缩进值比当前创建节点小的那个节点作为父节点，找到父节点后将当前创建的新节点放到父节点的children数组中，同时将父节点和当前创建的新节点push到解析路径中，同样更新当前创建的新节点为父节点。

if (token.type === "selector") { // 如果是选择器
    const selectorNode = { // 创建一个选择器节点，然后填充children和rules即可
        type: "selector",
        value: token.value,
        indent: token.indent,
        rules: [],
        children: []
    }
    if (selectorNode.indent > parentNode.indent) { // 当前节点的缩进大于其父节点的缩进，说明当前选择器节点是父节点的子节点
        path.push(selectorNode); // 将当前选择器节点加入到path中，路径变长了，当前选择器节点作为父节点
        parentNode.children.push(selectorNode); // 将当前选择器对象添加到父节点的children数组中
        parentNode = selectorNode; // 当前选择器节点作为父节点
    } else { // 缩进比其父节点缩进小，说明是非其子节点，可能是出现了同级的节点 
        parentNode = path.pop(); // 移除当前路径的最后一个节点
        while (token.indent <= parentNode.indent) { // 同级节点
            parentNode = path.pop(); // 拿到其父节点的父节点
        }
        // 找到父节点后，因为父节点已经从path中移除，所以还需要将父节点再次添加到path中
        path.push(parentNode, selectorNode);
        parentNode.children.push(selectorNode); // 找到父节点后，将当前选择器节点添加到父节点children中
        parentNode = selectorNode; // 当前选择器节点作为父节点
    }
}

接着处理类型为property的token，对于属性类型，和选择器类型差不多，我们需要创建一个rule对象，然后和当前父节点的缩进值进行比较，如果当前属性token的缩进值比当前父节点的缩进值大，说明是当前父节点的样式，直接将创建的rule对象添加到当前父节点的rules数组即可。如果当前属性token的缩进值比当前父节点的缩进值小，说明不是当前父节点的样式，那么我们就需要从当前解析路径中逐个取出最后一个节点，直到找到当前属性token的父节点，即找到缩进值比当前token缩进值小的那个节点作为父节点，找到父节点后，直接将创建的rule对象添加到父节点的rules数组中，同时将父节点再次放回到解析路径中即可。

if (token.type === "property") { // 如果是属性节点
    if (token.indent > parentNode.indent) { // 如果该属性的缩进大于父节点的缩进，说明是父节点选择器的样式
        parentNode.rules.push({ // 将样式添加到rules数组中 {property: "border", value:[]}
            property: token.value,
            value: [],
            indent: token.indent
        });
    } else { // 非当前父节点选择器的样式
        parentNode = path.pop(); // 取出并移除最后一个选择器节点，拿到当前父节点
        while (token.indent <= parentNode.indent) { // 与当前父节点的缩进比较，如果等于，说明与当前父节点同级，如果小于，则说明比当前父节点更上层
            parentNode = path.pop(); // 比当前父节点层次相等或更高，取出当前父节点的父节点，再次循环判其父节点，直到比父节点的缩进大为止
        }
        // 拿到了其父节点
        parentNode.rules.push({ // 将该样式添加到其父选择器节点中
            property: token.value,
            value: [],
            indent: token.indent
        });
        path.push(parentNode); // 由于父节点已从path中移除，需要再次将父选择器添加到path中
    }
    continue;
}

最后就是处理类型为value和variableRef的token了，这两个本质都属于值，只不过变量引用真实的值需要到变量字典中去取，对于值，我们不需要像上面一个通过缩进值去判断父节点，当前这个值肯定是属于当前父节点的，直接将值放到当前父节点的最后一个rule对象的value数组中即可。

if (token.type === "value") { // 如果是值节点
    // 拿到上一个选择器节点的rules中的最后一个rule的value将值添加进去
    parentNode.rules[parentNode.rules.length - 1].value.push(token.value);
    continue;
}

if (token.type === "variableRef") { // 如果是变量引用，从变量字典中取出值并添加到父节点样式的value数组中
    parentNode.rules[parentNode.rules.length - 1].value.push(variableDict[token.value]);
    continue;
}

tokens经过一个个遍历后，就按照上面的规则添加到了由根节点开始的树结构上，完整代码如下:

function parse(tokens) {
    const ast = { // 定义一个抽象语法树AST对象
        type: "root", // 根节点
        value: "root",
        children: [],
        rules: [],
        indent: -1
    };
    const path = [ast]; // 将抽象语法树对象放到数组中，即当前解析路径，最后一个元素为父元素
    let parentNode = ast; // 将当前根节点作为父节点
    let token;
    const variableDict = {}; // 保存定义的变量字典
    // 遍历所有的token
    while (token = tokens.shift()) {
        if (token.type === "variableDef") { // 如果这个token是变量定义
            if (tokens[0] && tokens[0].type === "value") { // 并且如果其下一个token的类型是值定义，那么这两个token就是变量的定义
                const variableValueToken = tokens.shift(); // 取出包含变量值的token
                variableDict[token.value] = variableValueToken.value; // 将变量名和遍历值放到vDict对象中
            }
            continue;
        }

        if (token.type === "selector") { // 如果是选择器
            const selectorNode = { // 创建一个选择器节点，然后填充children和rules即可
                type: "selector",
                value: token.value,
                indent: token.indent,
                rules: [],
                children: []
            }
            if (selectorNode.indent > parentNode.indent) { // 当前节点的缩进大于其父节点的缩进，说明当前选择器节点是父节点的子节点
                path.push(selectorNode); // 将当前选择器节点加入到path中，路径变长了，当前选择器节点作为父节点
                parentNode.children.push(selectorNode); // 将当前选择器对象添加到父节点的children数组中
                parentNode = selectorNode; // 当前选择器节点作为父节点
            } else { // 缩进比其父节点缩进小，说明是非其子节点，可能是出现了同级的节点 
                parentNode = path.pop(); // 移除当前路径的最后一个节点
                while (token.indent <= parentNode.indent) { // 同级节点
                    parentNode = path.pop(); // 拿到其父节点的父节点
                }
                // 找到父节点后，因为父节点已经从path中移除，所以还需要将父节点再次添加到path中
                path.push(parentNode, selectorNode);
                parentNode.children.push(selectorNode); // 找到父节点后，将当前选择器节点添加到父节点children中
                parentNode = selectorNode; // 当前选择器节点作为父节点
            }
        }

        if (token.type === "property") { // 如果是属性节点
            if (token.indent > parentNode.indent) { // 如果该属性的缩进大于父节点的缩进，说明是父节点选择器的样式
                parentNode.rules.push({ // 将样式添加到rules数组中 {property: "border", value:[]}
                    property: token.value,
                    value: [],
                    indent: token.indent
                });
            } else { // 非当前父节点选择器的样式
                parentNode = path.pop(); // 取出并移除最后一个选择器节点，拿到当前父节点
                while (token.indent <= parentNode.indent) { // 与当前父节点的缩进比较，如果等于，说明与当前父节点同级，如果小于，则说明比当前父节点更上层
                    parentNode = path.pop(); // 比当前父节点层次相等或更高，取出当前父节点的父节点，再次循环判其父节点，直到比父节点的缩进大为止
                }
                // 拿到了其父节点
                parentNode.rules.push({ // 将该样式添加到其父选择器节点中
                    property: token.value,
                    value: [],
                    indent: token.indent
                });
                path.push(parentNode); // 由于父节点已从path中移除，需要再次将父选择器添加到path中
            }
            continue;
        }

        if (token.type === "value") { // 如果是值节点
            // 拿到上一个选择器节点的rules中的最后一个rule的value将值添加进去
            parentNode.rules[parentNode.rules.length - 1].value.push(token.value);
            continue;
        }

        if (token.type === "variableRef") { // 如果是变量引用，从变量字典中取出值并添加到父节点样式的value数组中
            parentNode.rules[parentNode.rules.length - 1].value.push(variableDict[token.value]);
            continue;
        }
    }
    return ast;
}

对上一步生成的tokens解析后的结果如下:

{
    "type": "root",
    "value": "root",
    "children": [{
        "type": "selector",
        "value": "nav",
        "indent": 0,
        "rules": [{
            "property": "height",
            "value": ["100px"],
            "indent": 4
        }, {
            "property": "border",
            "value": ["1px", "solid", "red"],
            "indent": 4
        }],
        "children": []
    }, {
        "type": "selector",
        "value": "#content",
        "indent": 0,
        "rules": [{
            "property": "height",
            "value": ["300px"],
            "indent": 4
        }],
        "children": [{
            "type": "selector",
            "value": "p",
            "indent": 4,
            "rules": [{
                "property": "margin",
                "value": ["10px"],
                "indent": 8
            }],
            "children": [{
                "type": "selector",
                "value": ".selected",
                "indent": 8,
                "rules": [{
                    "property": "backgournd",
                    "value": ["yellow"],
                    "indent": 12
                }],
                "children": []
            }]
        }]
    }],
    "rules": [],
    "indent": -1
}

③ 转换
所谓转换就是对抽象语法树进行处理，将树结构对象转换成我们最终需要的数据对象，根据上面Sass编译后输出的源码，可以发现我们最终需要生成每个选择器下的样式，并且这个选择器是呈链式结构的，所以我们需要遍历抽象语法树，找到每个选择器及其样式，并记录当前选择器的父链，重新生成一个对象，如下:

// 根据这个对象我们就可以输出一条样式 #content p {margin: 10px}
{
    selector: "#content p", // 链式结构的选择器
    rules:[{"property":"margin","value":"10px","indent":8}], // 链式选择器最右边选择器的样式，每条样式包含属性名和属性值，以及该样式的缩进值
    indent: 4 // 链式选择器最右边选择器的缩进值
}

我们只需要传入上面生成的抽象语法树即根节点，然后进行递归遍历其子节点，如果节点的type类型为selector，我们就需要进行处理，拿到当前选择器下的所有样式组成的rules数组和选择器链一起生成上面结构的对象作为一条样式并放到styles数组中即可。

function transform(ast) {
    const styles = []; // 存放要输出的每一条样式
    function traverse(node, styles, selectorChain) {
        if (node.type === "selector") { // 如果是选择器节点
            selectorChain = [...selectorChain, node.value]; // 解析选择器层级关系，拿到选择器链
            if (node.rules.length > 0) {
                styles.push({
                    selector: selectorChain.join(" "),
                    rules: node.rules.reduce((rules, rule) => { // 遍历其rules, 拿到当前选择器下的所有样式
                        rules.push({ // 拿到该样式规则的属性和属性值并放到数组中
                            property: rule.property,
                            value: rule.value.join(" "),
                            indent: rule.indent
                        });
                        return rules;
                    }, []),
                    indent: node.indent
                });
            }
        }
        // 遍历根节点的children数组
        for (let i = 0; i < node.children.length; i++) {
            traverse(node.children[i], styles, selectorChain);
        }
    }
    traverse(ast, styles, []);
    return styles;
}

用上面的抽象语法树转换后生成的styles数组如下:

[{
    "selector": "nav",
    "rules": [{
        "property": "height",
        "value": "100px",
        "indent": 4
    }, {
        "property": "border",
        "value": "1px solid red",
        "indent": 4
    }],
    "indent": 0
}, {
    "selector": "#content",
    "rules": [{
        "property": "height",
        "value": "300px",
        "indent": 4
    }],
    "indent": 0
}, {
    "selector": "#content p",
    "rules": [{
        "property": "margin",
        "value": "10px",
        "indent": 8
    }],
    "indent": 4
}, {
    "selector": "#content p .selected",
    "rules": [{
        "property": "backgournd",
        "value": "yellow",
        "indent": 12
    }],
    "indent": 8
}]

④ 代码生成
上面经过转换后仍然是对象的形式，所以我们需要遍历每一条样式，对其rules数组中的每一个rule的属性和值用冒号拼接起来，然后将rules数组中的所有rule用换行符拼接起来生成样式规则字符串，然后与选择器一起拼接成一条字符串形式的样式即可。

function generate(styles) {
    return styles.map(style => { // 遍历每一条样式
        const rules = style.rules.reduce((rules, rule) => { // 将当前样式的所有rules合并起来
            return rules += `\n${" ".repeat(rule.indent)}${rule.property}:${rule.value};`;
        }, "");
        return `${" ".repeat(style.indent)}${style.selector} {${rules}}`;
    }).join("\n");
}

从零实现一个Sass预处理器

一、Sass预处理器简介

二、编译器简介

三、实现Sass预处理器

JS_Even_JS

引用和评论

继承的艺术: 探索JS中实现继承的多种方式

2025年最新反编译微信小程序的教程及工具

手写一个动态海洋和天空效果的vue hooks

你可能不知道的图片加载相关知识

原生JS大揭秘—JS代码执行原理解刨

使用CSS给标题添加书名号并超出省略

原生electron起步-从零到一完成构建和打包