为什么要在 Bash 中避免使用 eval,而应该使用什么?


一次又一次,我在 Stack Overflow 上看到 Bash 答案,使用 eval 并且答案被抨击,双关语,因为使用了这种“邪恶”的结构。为什么 eval 如此邪恶?

如果 eval 不能安全使用,应该改用什么?

这个问题比表面上看到的要多。我们将从显而易见的开始: eval 有可能执行“脏”数据。脏数据是任何未被重写为可安全使用的数据-XYZ;在我们的例子中,它是任何没有被格式化以便安全评估的字符串。

乍一看,清理数据似乎很容易。假设我们正在抛出一个选项列表,bash 已经提供了一种清理单个元素的好方法,以及另一种将整个数组作为单个字符串进行清理的方法:

 function println
    # Send each element as a separate argument, starting with the second element.
    # Arguments to printf:
    #   1 -> "$1\n"
    #   2 -> "$2"
    #   3 -> "$3"
    #   4 -> "$4"
    #   etc.

    printf "$1\n" "${@:2}"

function error
    # Send the first element as one argument, and the rest of the elements as a combined argument.
    # Arguments to println:
    #   1 -> '\e[31mError (%d): %s\e[m'
    #   2 -> "$1"
    #   3 -> "${*:2}"

    println '\e[31mError (%d): %s\e[m' "$1" "${*:2}"
    exit "$1"

# This...
error 1234 Something went wrong.
# And this...
error 1234 'Something went wrong.'
# Result in the same output (as long as $IFS has not been modified).

现在假设我们要添加一个选项来重定向输出作为 println 的参数。当然,我们可以在每次调用时重定向 println 的输出,但为了举例,我们不打算这样做。我们需要使用 eval ,因为变量不能用于重定向输出。

 function println
    eval printf "$2\n" "${@:3}" $1

function error
    println '>&2' '\e[31mError (%d): %s\e[m' "$1" "${*:2}"
    exit $1

error 1234 Something went wrong.

看起来不错,对吧?问题是,eval 解析了两次命令行(在任何 shell 中)。在解析的第一遍中,一层引用被删除。删除引号后,将执行一些可变内容。

我们可以通过让变量扩展发生在 eval 中来解决这个问题。我们所要做的就是将所有内容单引号,将双引号留在原处。一个例外:我们必须在 eval 之前扩展重定向,因此必须保留在引号之外:

 function println
    eval 'printf "$2\n" "${@:3}"' $1

function error
    println '&2' '\e[31mError (%d): %s\e[m' "$1" "${*:2}"
    exit $1

error 1234 Something went wrong.

这应该有效。只要 $1 in println 从不脏,它也是安全的。

现在稍等一下:我一直使用与 sudo 相同的不带 引号 的语法!为什么它在那里工作,而不是在这里?为什么我们必须单引号引用所有内容? sudo 更现代一点:它知道将收到的每个参数括在引号中,尽管这过于简化了。 eval 简单地连接所有内容。

不幸的是,没有直接替代 eval 的方法来处理像 sudo 这样的参数,因为 eval 是一个内置的 shell;这很重要,因为它在执行时会占用周围代码的环境和范围,而不是像函数那样创建新的堆栈和范围。


特定用例通常有 eval 的可行替代方案。这是一个方便的清单。 command 代表您通常发送给 eval 的内容;随意替换。


一个简单的冒号在 bash 中是无操作的:



( command )   # Standard notation



 $(command)   # Preferred
`command`    # Old: should be avoided, and often considered deprecated

# Nesting:
$(command1 "$(command2)")
`command "\`command\`"`  # Careful: \ only escapes $ and \ with old style, and
                         # special case \` results in nesting.


在调用代码中,将 &3 (或高于 &2 的任何内容)映射到您的目标:

 exec 3<&0         # Redirect from stdin
exec 3>&1         # Redirect to stdout
exec 3>&2         # Redirect to stderr
exec 3> /dev/null # Don't save output anywhere
exec 3> file.txt  # Redirect to file
exec 3> "$var"    # Redirect to file stored in $var--only works for files!
exec 3<&0 4>&1    # Input and output!

如果是一次性调用,则不必重定向整个 shell:

 func arg1 arg2 3>&2

在被调用的函数中,重定向到 &3

 command <&3       # Redirect stdin
command >&3       # Redirect stdout
command 2>&3      # Redirect stderr
command &>&3      # Redirect stdout and stderr
command 2>&1 >&3  # idem, but for older bash versions
command >&3 2>&1  # Redirect stdout to &3, and stderr to stdout: order matters
command <&3 >&4   # Input and output!



 VAR='1 2 3'


 eval "echo \"\$$REF\""

为什么?如果 REF 包含双引号,这将破坏并打开代码以进行攻击。可以对 REF 进行消毒,但是如果你有这个,那就是浪费时间:

 echo "${!REF}"

没错,bash 从第 2 版开始就内置了可变间接。如果您想做更复杂的事情,它比 eval 有点棘手:

 # Add to scenario:
VAR_2='4 5 6'

# We could use:
local ref="${REF}_2"
echo "${!ref}"

# Versus the bash < 2 method, which might be simpler to those accustomed to eval:
eval "echo \"\$${REF}_2\""

无论如何,新方法更直观,尽管对于习惯于 eval 的经验丰富的编程人员来说似乎不是这样。


关联数组本质上是在 bash 4 中实现的。需要注意的是:它们必须使用 declare 创建。

 declare -A VAR   # Local
declare -gA VAR  # Global

# Use spaces between parentheses and contents; I've heard reports of subtle bugs
# on some versions when they are omitted having to do with spaces in keys.
declare -A VAR=( ['']='a' [0]='1' ['duck']='quack' )

VAR+=( ['alpha']='beta' [2]=3 )  # Combine arrays

VAR['cow']='moo'  # Set a single element
unset VAR['cow']  # Unset a single element

unset VAR     # Unset an entire array
unset VAR[@]  # Unset an entire array
unset VAR[*]  # Unset each element with a key corresponding to a file in the
              # current directory; if * doesn't expand, unset the entire array

local KEYS=( "${!VAR[@]}" )  # Get all of the keys in VAR

在旧版本的 bash 中,您可以使用变量间接:

 VAR=( )  # This will store our keys.

# Store a value with a simple key.
# You will need to declare it in a global scope to make it global prior to bash 4.
# In bash 4, use the -g option.
declare "VAR_$key"="$value"
# Or, if your version is lacking +=
VAR=( "$VAR[@]" "$key" )

# Recover a simple value.
local var_key="VAR_$key"       # The name of the variable that holds the value
local var_value="${!var_key}"  # The actual value--requires bash 2
# For < bash 2, eval is required for this method.  Safe as long as $key is not dirty.
local var_value="`eval echo -n \"\$$var_value\""

# If you don't need to enumerate the indices quickly, and you're on bash 2+, this
# can be cut down to one line per operation:
declare "VAR_$key"="$value"                         # Store
echo "`var_key="VAR_$key" echo -n "${!var_key}"`"   # Retrieve

# If you're using more complex values, you'll need to hash your keys:
function mkkey
    local key="`mkpasswd -5R0 "$1" 00000000`"
    echo -n "${key##*$}"

local var_key="VAR_`mkkey "$key"`"
# ...

如何使 eval 安全

eval 可以 安全使用 - 但需要首先引用它的所有参数。就是这样:


 function token_quote {
  local quoted=()
  for token; do
    quoted+=( "$(printf '%q' "$token")" )
  printf '%s\n' "${quoted[*]}"



 % input="Trying to hack you; date"

构造一个 eval 的命令:

 % cmd=(echo "User gave:" "$input")

看似 正确的引用来评估它:

 % eval "$(echo "${cmd[@]}")"
User gave: Trying to hack you
Thu Sep 27 20:41:31 +07 2018

注意你被黑了。 date 被执行而不是按字面打印。

而不是 token_quote()

 % eval "$(token_quote "${cmd[@]}")"
User gave: Trying to hack you; date

eval 不是邪恶的——只是被误解了:)

