如何在推理的时候对图像做自动的resize

下面这个配置参数是什么意思?
mm_processor_kwargs’: {‘max_pixels’: 1}

mm_processor_kwargs: {'max_pixels': 1} 表示在多模态模型中,传递给多模态处理器(如图像处理器)的参数,将输入图片的最大像素数限制为1。这通常用于控制图片在预处理时的分辨率上限,从而减少显存消耗或加快推理速度。实际应用中,max_pixels 应设置为合理的像素数(如 768*768),否则图片会被极度压缩,影响模型效果。详细说明见 官方文档API文档

需要更多细节吗?

Sources:

Hint: Mention @RunLLM in the post for followups.