请教模型部署问题

我有多个训练好的不同用处的模型,每个都是大约200M,有一块10G显存的GPU卡,想把这些模型都部署在这卡上,请大家出主意,该如何编程?该注意哪些问题?以便有比较好的响应时间和效率。这些模型是有可能需要同时运行的。谢谢大家