A ver, que seguís liando el cargar algo en memoria con que se renderice. Sin saber cómo funciona su motor, es dar palos de ciego.
Cargar un modelo en memoria, sin más datos que eso, puede ser desde algo tan simple como simplemente cargar el modelo (que es una lista de coordenadas, prácticamente gratis) a que rasterice o se renderice, con la carga poligonal que implica. Y aún poniéndonos en ese caso, depende de cómo funcione su sistema de cámara, lo más normal a día de hoy para cualquier motor es que cargue el campo de visión del jugador y unos grados a cada lado, descargando lo que está fuera de ese rango (y dentro de esto, se puede entrar también en la profundidad y los planos, descargando cosas fuera del campo de visión o tapadas). A mayores, internamente aunque toda la ciudad sea un modelo, tú puedes dividir el terreno en el que está colocado en chunks e ir cargando lo que está en cada uno (y su información, claro, hace años que se puede trocear un modelo en tiempo real en base a necesidades, por ejemplo con los sistemas de destrucción o de desmembramiento) de los que está alrededor del jugador y los adyacentes, predeciendo su movimiento en base al input, por lo que aún podrías solo renderizar lo que hace falta.
Calificarlo de cagada histórica y demás sin tener nada de información de cómo funciona su motor o de cómo lo han implementado, es más que atrevido.
Y no defiendo a GF porque me parecen de los equipos más vagos o limitados del mundillo, pero una cosa es atizarles con razón y otra una caza de brujas.