最初的尝试是一场灾难。一个简单的 Flask 应用,通过 tensorflow.keras.models.load_model 加载模型,然后用 Gunicorn 部署了几个 worker。当流量只有每秒几次请求时,一切看起来都还不错。但当
2023-10-27