Botanophobia::Logging

这是什么

R 的 ifelse

标签: R

问题

三目运算符实在太好用了,虽然同样可以用 ifelse 进行(而且更直观),但是在短小的简单的语句里面,会更简洁,比如

index <- ifelse(mapped(k, m), 1, 2)

这样就可以在一行内完成赋值。

但是慢慢在使用中,就会遇到这样的一个问题。

# EXAMPLE 1
df1 <- data.frame(a = c(1,2), b = c(3, 4))
df2 <- df1
df3 <- ifelse(TRUE, df1, df2)

看上去似乎,df3 就是是一个与 df1 相同的 DataFrame。当运行后,结果则是

[[1]]
[1] 1 2

这是 df1$a , 那么这里面一定会有问题。

ifelse

直接查看 ifelse 的源码:

function (test, yes, no) {
    if (is.atomic(test)) {
        if (typeof(test) != "logical")
            storage.mode(test) <- "logical"
        if (length(test) == 1 && is.null(attributes(test))) {
            if (is.na(test))
                return(NA)
            else if (test) {
                if (length(yes) == 1) {
                  yat <- attributes(yes)
                  if (is.null(yat) || (is.function(yes) && identical(names(yat),
                    "srcref")))
                    return(yes)
                }
            }
            else if (length(no) == 1) {
                nat <- attributes(no)
                if (is.null(nat) || (is.function(no) && identical(names(nat),
                  "srcref")))
                  return(no)
            }
        }
    }
    else test <- if (isS4(test))
        methods::as(test, "logical")
    else as.logical(test)
    ans <- test
    len <- length(ans)
    ypos <- which(test)
    npos <- which(!test)
    if (length(ypos) > 0L)
        ans[ypos] <- rep(yes, length.out = len)[ypos]
    if (length(npos) > 0L)
        ans[npos] <- rep(no, length.out = len)[npos]
    ans
}

可以看到,虽然我们在 [EXAMPLE 1] 中所用到的 test 的长度为 1,但是由于 yesno 作为 DataFrame 调用 length 都不是 1,而是 2。所以在后面只会选择 df1 的第一部分,也就是我们得到的结果。那么为了避免这个问题,解决方案也非常简单了。

# EXAMPLE 2
df1 <- data.frame(a = c(1,2), b = c(3, 4))
df2 <- df1
df3 <- ifelse(TRUE, list(df1), list(df2))[[1]]

df1 加上一个 list 的包装避免 length 的判断,然后用 [[1]] 提取内部的内容。换句话说,如果有一个类,能够保证 length == 1 并且做好 settergetter 就可以用来替代啦~