Mira esto primero:
https://huggingface.co/docs/transformers/main/tasks/monocular_depth_estimation
hay más ejemplos en esta página, te manda ir Fran Puentes Calvo
https://github.com/FranPuentes/iTI2025/blob/main/08%20depth%20estimation.ipynb
en el ejercicio 8 estimación de profundidad
pip install -q -U transformers
Funciona en Google Colab
Puedes poner otra url de otra fotografia