Es importante tener claro la diferencia entre la distribución marginal de $y$ y la distribución condicional. Es perfectamente posible que $y$ sea sesgado, pero que $y|x$ sea normal (digamos) --- pero la suposición no es acerca de $y$, es acerca de $y|x$.
Así que la asimetría en $y$ no es de por sí motivo de preocupación. Puede que no implique nada, e incluso si también está asociada con cierta asimetría en la distribución condicional, eso podría no afectar tanto tu estimación* (aunque podría afectar un poco tu inferencia, especialmente si los tamaños de muestra son pequeños; con tamaños de muestra grandes incluso esta preocupación desaparece).
* La recta de mínimos cuadrados seguirá siendo la mejor estimación lineal insesgada, por ejemplo, así que siempre y cuando no sea tan sesgada que los estimadores lineales como clase se vuelvan demasiado malos para ser sostenibles, los mejores de ellos deberían estar bien.
De mucho más preocupación:
1) tu visualización indica una fuerte heterocedasticidad. Esto impactará tu inferencia (intervalos de confianza y pruebas) sin importar cuán grande sea tu tamaño de muestra.
2) Claras señales de no linealidad. En particular, (mirando solo los puntos, ya que creo que la suavización no funcionó bien debido a otros problemas) la relación parece aumentar rápidamente en valores pequeños de $x$ (hasta aproximadamente 1500 por ejemplo) pero luego casi plana.
3) tu variable x tiene un valor atípico influyente (o potencialmente un punto influyente que podría ser un valor atípico, dependiendo de lo que se haga acerca de la heterocedasticidad y de cómo se modele la no linealidad).
Sugeriría mirar una transformación de $y$ en tu gráfico, no tanto por la asimetría en la distribución marginal, sino para reducir el impacto de (1), de modo que se puedan investigar con más detalle los problemas con (2) y (3).
Podrías considerar mirar uno o ambos de (i) log y vs x, y (ii) log y vs log x (este último podría ser ligeramente más útil). Esperaría que ninguno sea lineal, pero podrían ayudarte a elegir un modelo adecuado tanto para la relación entre las variables como para la distribución condicional de $y$ (especialmente en relación con su varianza).