Earn 20 XP


¿Qué es indexar en Pandas?

  • Indexar en Pandas significa seleccionar filas y columnas particulares desde un DataFrame.
  • Indexar en Pandas es lo mismo que hicimos para una Lista de Python y un arreglo de NumPy.
  • Hay dos métodos diferentes de indexar en Pandas:
    • loc - selección basada en etiquetas
    • iloc - selección basada en índices

Selección basada en índices

  • La selección basada en índices corresponde a seleccionar datos basados en su posición numérica dentro de un DataFrame.
  • iloc es utilizado para seleccionar datos basados en su posición numérica.
  • La sintaxis usada para el operador iloc es:
    1 df.iloc[ ]
    Donde df es el nombre de un DataFrame. Puedes entregar la posición numérica de filas y columnas a seleccionar en los corchetes cuadrados.
  • ¿Recuerdas la indexación en un arreglo de NumPy? Si no, no te preocupes; pronto verás la implementación en un cunjunto de datos.
  • Importa la librería de Pandas y carga el archivo "exam_scores.csv".

image.png

Seleccionando datos usando iloc:

image.png

image.png

  • También puedes entregar una lista de índices

image.png

  • También puedes entregar índices negativos

image.png

Selección basada en etiquetas

  • La selección por etiqueta se vasa en los nombres/índices de la columna o fila.
  • La selección basada en etiquetas es realizada con loc.
  • ¿Recuerdas la indexacción por defecto de los DataFrames de Python y los índices/nombres que cambiaste en los tópicos previos?
  • iloc y loc son conceptualmente similares. La diferencia es que iloc considera la indexación por defecto, mientras que loc la ignora.
  • loc es utilizado para seleccionar información basado en el valor/nombre de los índices de los datos, sin considerar su posición numérica.
  • La sintaxis de loc es similar a la de iloc:
    1 df.loc[ ]
    Donde df es el nombre del DataFrame.
  • Pronto aprenderemos su implementación en un conjunto de datos.

Seleccionando datos usando loc:

image.png