清晰架构（Clean Architecture）的Go微服务: 日志管理

良好的日志记录可以提供丰富的日志数据，便于在调试时发现问题，从而大大提高编码效率。记录器提供的自动化信息越多越好，日志信息也需要以简洁的方式呈现，便于找到重要的数据。

日志需求:

无需修改业务代码即可切换到其他日志库
不需直接依赖任何日志库
整个应用程序只有一个日志库的全局实例，因此你可以在一个位置更改日志配置并将其应用于整个程序。
可以在不修改代码的情况下轻松更改日志记录选项，例如，日志级别
能够在程序运行时动态更改日志级别

资源句柄：为什么日志记录与数据库不同

当应用程序需要处理外部资源时，例如数据库，文件系统，网络连接， SMTP服务器时，它通常需要一个资源句柄（Resource Handler）。在依赖注入中，容器创建一个资源句柄并将其注入每个业务函数，因此它可以使用资源句柄来访问底层资源。在此应用程序中，资源句柄是一个接口，因此业务层不会直接依赖于资源句柄的任何具体实现。数据库和gRPC链接都以这种方式处理。

但是，日志记录器稍有不同，因为几乎每个函数都需要它，但数据库不是。在Java中，我们为每个Java类初始化一个记录器（Logger）实例。 Java日志记录框架使用层次关系来管理不同的记录器，因此它们从父日志记录器继承相同的日志配置。在Go中，不同的记录器之间没有层次关系，因此你要么创建一个记录器，要么具有许多彼此不相关的不同记录器。为了获得一致的日志记录配置，最好创建一个全局记录器并将其注入每个函数。但者将需要做很多工作，所以我决定在一个中心位置创建一个全局记录器，每个函数可以直接引用它。

为了不将应用程序紧密绑定到特定的记录器，我创建了一个通用的记录器接口，因此应用程序对于具体的记录器透明的。以下是记录器（Logger）接口。

// Log is a package level variable, every program should access logging function through "Log"
var Log Logger

// Logger represent common interface for logging function
type Logger interface {
    Errorf(format string, args ...interface{})
    Fatalf(format string, args ...interface{})
    Fatal(args ...interface{})
    Infof(format string, args ...interface{})
    Info( args ...interface{})
    Warnf(format string, args ...interface{})
    Debugf(format string, args ...interface{})
    Debug(args ...interface{})
}

因为每个文件都依赖于日志记录，很容易产生循环依赖，所以我在“容器”包里面创建了一个单独的子包“logger”来避免这个问题。它只有一个“Log”变量和“Logger”接口。每个文件都通过这个变量和接口访问日志功能。

记录器封装：

支持一个日志库的标准方法（例如ZAP¹或Logrus²) 是创建一个封装来实现已经创建的记录器接口。这很简单，以下是代码。

type loggerWrapper struct {
    lw *zap.SugaredLogger
}
func (logger *loggerWrapper) Errorf(format string, args ...interface{}) {
    logger.lw.Errorf(format, args)
}
func (logger *loggerWrapper) Fatalf(format string, args ...interface{}) {
    logger.lw.Fatalf(format, args)
}
func (logger *loggerWrapper) Fatal(args ...interface{}) {
    logger.lw.Fatal(args)
}
func (logger *loggerWrapper) Infof(format string, args ...interface{}) {
    logger.lw.Infof(format, args)
}
func (logger *loggerWrapper) Warnf(format string, args ...interface{}) {
    logger.lw.Warnf(format, args)
}
func (logger *loggerWrapper) Debugf(format string, args ...interface{}) {
    logger.lw.Debugf(format, args)
}
func (logger *loggerWrapper) Printf(format string, args ...interface{}) {
    logger.lw.Infof(format, args)
}
func (logger *loggerWrapper) Println(args ...interface{}) {
    logger.lw.Info(args, "\n")
}

但是日志记录存在一个问题。日志记录的一个功能是在日志消息中打印记录者名字。在对接口封装之后，方法的调用者不是打印日志的程序，而是封装程序。要解决该问题，你可以直接更改日志库的源代码，但在升级日志库时会导致兼容性问题。最终的解决方案是要求日志记录库创建一个新功能，该功能可以根据方法是否使用封装来返回合适的调用方。

为了让代码现在能正常工作，我走了捷径。因为ZAP和Logrus之间的大多数函数签名是相似的，所以我提取了常用的签名并创建了一个共享接口，因为两个日志库都已经有了这些函数，它们自动实现这些接口。 Go接口设计的优点在于，你可以先创建具体实现，然后再创建接口，如果函数签名相互匹配，则自动实现接口。这有点作弊，但非常有效。如果要用的记录器不支持公共的接口，则还是要对它进行封装，这样就只能暂时先牺牲调用者功能或修改源代码。

日志库比较:

不同的日志库提供不同的功能，其中一些功能对于调试很重要。

需要记录的重要信息（需要以下数据）：

文件名和行号
方法名称和调用文件名
消息记录级别
时间戳
错误堆栈跟踪
自动记录每个函数调用包括参数和结果

我希望日志库自动提供这些数据，例如调用方法名称，而不编写显式代码来实现。对于上述6个功能，目前没有日志库提供＃6，但它们都提供1到5个中的部分或全部。我尝试了两个非常流行的日志库Logrus和ZAP。 Logrus提供了所有功能，但是我的控制台上的格式不正确（它在我的Windows控制台上显示“ n t”而不是新行）并且输出格式不像ZAP那样干净。 ZAP不提供＃2，但其他一切看起来都不错，所以我决定暂时使用它。

令人惊讶的是，本程序被证明是一个非常好的工具来测试不同的日志库，因为你可以切换到不同的日志库来比较输出结果，而只需要更改配置文件中的一行。这不是本程序的功能，而是一个好的副作用。

实际上，我最需要的功能是自动记录每个函数调用包括参数和结果（#6），但是还没有日志库提供该功能提供。我希望将来能够得到它。

错误（error）处理:

错误处理与日志记录直接相关，所以我也在这里讨论一下。以下是我在处理错误时遵循的规则。

1.使用堆栈跟踪创建错误

错误消息本身需要包含堆栈跟踪信息。如果错误源自你的程序，你可以导入“github.com/pkg/errors”库来创建错误以包含堆栈跟踪。但是如果它是从另一个库生成的并且该库没有使用“pkg/errors”，你需要用“errors.Wrap（err，message）”语句包装该错误，以获取堆栈跟踪信息。由于我们无法控制第三方库，因此最好的解决方案是在我们的程序中对所有错误进行包装。详情请见[这里](https://dave.cheney.net/2016/06/12/stack-traces-and-the-errors-package)³。

2.使用堆栈跟踪打印错误
你需要使用“logger.Log.Errorf（”％+vn“，err）”或“fmt.Printf（”％+vn“，err）”以便打印堆栈跟踪信息，关键是“+v”选项（当然你必须已经使用＃1）。

3.只有顶级函数才能处理错误
“处理”表示记录错误并将错误返回给调用者。因为只有顶级函数处理错误，所以错误只在程序中记录一次。顶层的调用者通常是面向用户的程序，它是用户界面程序（UI）或另一个微服务。你希望记录错误消息（因此你的程序中具有记录），然后将消息返回到UI或其他微服务，以便他们可以重试或对错误执行某些操作。

4.所有其他级别函数应只是将错误传播到较高级别
底层或中间层函数不要记录或处理错误，也不要丢弃错误。你可以向错误中添加更多数据，然后传播它。当出现错误时，你不希望停止整个应用程序。

恐慌（Panic）:

除了在本地的“main.go”之外，我从未使用过恐慌（Panic）。它更像是一个bug而不是一个功能。在让我们谈谈日志⁴中，Dave Cheney写道“人们普遍认为应用库不应该使用恐慌”。另一个错误是log.Fatal，它具有与恐慌相同的效果，也应该被禁止。 “log.Fatal”更糟糕，它看起来像一个日志，但是在输出日志后它“恐慌”，这违反了单一责任规则。

恐慌有两个问题。首先，它与错误的处理方式不同，但它实际上是一个错误，一个错误的子类型。现在，错误处理代码需要处理错误和恐慌，例如事务处理代码⁵中的错误处理代码。其次，它会停止应用程序，这非常糟糕。只有顶级主控制程序才能决定如何处理错误，所有其他被调用的函数应该只将错误传播到上层。特别是现在，服务网格层（Service Mesh）可以提供重试等功能，恐慌使其更加复杂。

如果你正在调用第三方库并且它在代码中产生恐慌，那么为了防止代码停止，你需要截获恐慌并从中恢复。以下是代码示例，你需要为每个可能发生恐慌的顶级函数执行此操作（在每个函数中放置“defer catchPanic（）”）。在下面的代码中，我们有一个函数“catchPanic”来捕获并从恐慌中恢复。函数“RegisterUser”在代码的第一行调用“defer catchPanic（）”。有关恐慌的详细讨论，请参阅此处⁶。

func catchPanic() {
    if p := recover(); p != nil {
        logger.Log.Errorf("%+v\n", p)
    }
}

func (uss *UserService) RegisterUser(ctx context.Context, req *uspb.RegisterUserReq)
    (*uspb.RegisterUserResp, error) {
    
     defer catchPanic()
    ruci, err := getRegistrationUseCase(uss.container)
    if err != nil {
        logger.Log.Errorf("%+v\n", err)
        return nil, errors.Wrap(err, "")
    }
    mu, err := userclient.GrpcToUser(req.User)
...
}