1 votos

Preguntas de los analistas de datos novatos

Recientemente he solicitado un puesto de trabajo por una startup que quiere subir un analista de datos. He estado haciendo las rondas y parece que quieren contratarme para el puesto. Soy recién licenciado en estadística y aún no he adquirido experiencia laboral. Sin embargo, esta empresa nunca ha tenido un analista de datos y me están haciendo preguntas a las que todavía no tengo respuesta debido a mi falta de experiencia laboral. Probablemente también sea útil mencionar que la empresa quiere que recoja datos de una aplicación móvil. Las preguntas son las siguientes:

  1. ¿Cómo se van a recoger los datos del promotor?

  2. ¿Cómo vas a recoger los datos sin un tercero (creo que se refiere a no utilizar google analytics u otra herramienta como Cognos.)

  3. ¿Cuál es la mejor herramienta para recopilar datos de Apple?

  4. ¿Qué vas a hacer primero cuando tengas los datos?

No me han dicho cuáles son los objetivos por el momento de la empresa. Supongo que utilizaré SQL para recoger datos de su base de datos. No estoy seguro de cómo se supone que debo obtener los datos del desarrollador. He buscado en Internet sobre el seguimiento de las métricas de las aplicaciones móviles, pero me gustaría saber si existe un procedimiento estándar diario que los analistas de datos realicen cuando trabajan con aplicaciones móviles. ¿Qué tipo de herramientas recomendarías para trabajar con aplicaciones móviles? Sé que esta pregunta es un poco amplia pero me encantaría que un analista de datos con experiencia le dijera a un novato cómo va. Sobre todo porque tengo la sensación de que ellos tampoco saben lo que debe hacer un analista de datos.

1voto

Isabella Ghement Puntos 9964

Bienvenido al sitio, @Nick, y buena suerte con tu solicitud de empleo. Voy a intervenir en relación con tu cuarta pregunta.

Cuando los datos se recogen desde cero, como parece ser el caso aquí, hay que entender primero por qué los datos se recogen. Digamos que, en este caso, los datos se recogen para ayudar a la empresa a predecir qué clientes son propensos a abandonar un servicio ofrecido por la empresa. El sitio web por qué impulsará cómo los datos serán analizados.

Por lo tanto, antes de examinar cualquier dato que se le entregue, asegúrese de comprender las preguntas que la empresa desea responder a partir de esos datos. Por ejemplo:

  • ¿Son los hombres más propensos que las mujeres a optar por este servicio, en igualdad de condiciones?
  • ¿Son las personas mayores más propensas a renunciar a este servicio que los jóvenes, en igualdad de condiciones?
  • ¿Son los clientes de larga duración menos propensos a abandonar este servicio que los clientes recientes, en igualdad de condiciones?

Con estas preguntas claras en su mente, lo primero que tendrá que hacer es intentar importar los datos en el software estadístico de su elección (por ejemplo, R). Es posible que descubras que los datos no están correctamente formateados para su importación (por ejemplo, están guardados en una hoja de cálculo con anotaciones de texto realizadas por el desarrollador). Así que formatear los datos para la importación podría ser su primera tarea (por ejemplo, eliminar todas las anotaciones de texto de los datos). Crear una copia de seguridad del conjunto de datos original también es una buena idea.

Suponiendo que los datos puedan ser importados en el software estadístico de su elección, lo primero que querrá hacer es observar cada una de las variables de interés para su análisis y describir su distribución numérica y visualmente. Por ejemplo, una de las variables podría ser el género (una variable cualitativa): busque cuántas personas de cada género hay en su conjunto de datos. Otra variable podría ser la duración de la relación con la empresa (expresada en meses), una variable cuantitativa. Así, podría trazar el histograma de la duración, informar de la duración media (y una desviación estándar), etc.

Esta exploración inicial de los datos le permitirá determinar si los datos presentan algún problema que deba abordarse:

  1. ¿Dispone de todos los datos que necesita para sus análisis o aún no dispone de datos sobre variables o casos cruciales (por ejemplo, clientes)?

  2. ¿Están bien codificadas las variables cualitativas (por ejemplo, el género)? Si no es así, ¿tendrá que limpiar esas variables para asegurarse de que sus categorías se codifican de forma coherente?

  3. ¿Las variables cuantitativas (por ejemplo, la duración) presentan valores sin sentido (por ejemplo, alguien tiene una duración de -12 meses) o valores que son inverosímilmente grandes o pequeños?

  4. ¿Alguna de las variables necesarias incluye valores ausentes y, en caso afirmativo, cuál es el grado de ausencia?

  5. ¿Hay que recodificar alguna de las variables necesarias?

1 votos

Gracias por la respuesta tan detallada. El lunes tengo una entrevista con el jefe, así que esta información me vendrá muy bien.

0 votos

Lo ideal sería vigilar el proceso de recopilación de datos a medida que se desarrolla: ¿los datos preliminares parecen correctos o hay algún problema que deba abordarse a medida que avanza la recopilación de datos? Buena suerte el lunes. Cuéntanos qué tal te ha ido.

0 votos

No olvide hacer preguntas como: "¿Cómo ha recopilado datos de los promotores en el pasado? ¿Qué ha funcionado y qué no? ¿Se puede mejorar el proceso anterior para esta tarea actual?", "¿Podemos centrarnos en recoger los datos más importantes para este proyecto en una primera fase? Siempre es tentador recopilar demasiados datos, pero eso también reduce las posibilidades de éxito en la ejecución del proyecto", etc.

i-Ciencias.com

I-Ciencias es una comunidad de estudiantes y amantes de la ciencia en la que puedes resolver tus problemas y dudas.
Puedes consultar las preguntas de otros usuarios, hacer tus propias preguntas o resolver las de los demás.

Powered by:

X