Язык программирования Python в 1991 году Гвидо ван Россумом был создан язык программирования Python. Назван он был в честь любимого шоу создателя– «Летающий цирк Монти Пайтона»



бет5/7
Дата23.09.2023
өлшемі5 Mb.
#182164
1   2   3   4   5   6   7
Байланысты:
Практическая работа №1

DataFrame
Загрузка данных из файла .csv в DataFrame.

Аргумент sep позволяет указать разделитель. Также доступно чтение из txt (read_txt) файла и xlsx файла (read_excel).
Задать столбцы и значения можно вручную:

Полезным является метод describe(), который позволяет узнать основные статистические показатели по столбцам датафрейма.

Можно создать новый столбец, используя известные данные:

Значения в DataFrame или Series можно отфильтровать:

Обращение к датафрейму, метод iloc – индексация по позиции:

Метод loc – индексация на основе имени:

Так же с помощью loc можно фильтровать данные, например, выведем данные, где значение признака А > 3 и значение признака В < 16:

Метод apply() позволяет применить к серии или датафрейму некоторую функцию, например, создание нового признака, если значение в столбце A меньше 5 или больше:

axis = 1 – это проход по строкам, axis = 0 – это проход по столбцам, например:

Библиотека scikit-learn.
scikit-learn – это библиотека для эффективного предиктивного анализа данных. Она содержит в себе различные алгоритмы машинного обучения, инструменты для предобработки данных, готовые наборы данных для исследований и тд.
Готовые датасеты можно взять в модуле dataset. У каждого датасета есть функция для его загрузки.
Рассмотрим пример загрузки датасета Ames housing:

В результате df – это объект Bunch, который представляет собой аналог словаря в библиотеке Scikit-Learn. Соответственно, у него есть ключи.

data – это таблица признаков. target – это значение целевой переменной. Этот набор данных используется для прогнозирования стоимости дома.

Подробнее данную библиотеку рассмотрим в следующих практических работах.


Практическая работа

  1. Установить Python, если это не было сделано ранее.

  2. Написать программу, которая вычисляет площадь фигуры, параметры которой подаются на вход. Фигуры, которые подаются на вход: треугольник, прямоугольник, круг. Результатом работы является словарь, где ключ – это название фигуры, а значение – это площадь.

  3. Написать программу, которая на вход получает два числа и операцию, которую к ним нужно применить. Должны быть реализованы следующие операции: +, -, /, //, abs – модуль, pow или ** – возведение в степень.

  4. Напишите программу, которая считывает с консоли числа (по одному в строке) до тех пор, пока сумма введённых чисел не будет равна 0 и после этого выводит сумму квадратов всех считанных чисел.

  5. Напишите программу, которая выводит последовательность чисел, длинною N, где каждое число повторяется столько раз, чему оно равно. На вход программе передаётся неотрицательное целое число N. Например, если N = 7, то программа должна вывести 1 2 2 3 3 3 4. Вывод элементов списка через пробел – print(*list).

  6. Даны два списка:

А = [1, 2, 3, 4, 2, 1, 3, 4, 5, 6, 5, 4, 3, 2]
В = [‘a’, ’b’, ’c’, ’c’, ’c’, ’b’, ’a’, ’c’, ’a’, ’a’, ’b’, ’c’, ’b’, ’a’]
Создать словарь, в котором ключи – это содержимое списка В, а значения для ключей словаря – это сумма всех элементов списка А в соответствии с буквой, содержащийся на той же позиции в списке В. Пример результата программы: {‘a’ : 10, ‘b’ : 15, ‘c’ : 6}.
Скачать и загрузить данные о стоимости домов в калифорнии, используя библиотеку sklearn.


  1. Получить полный датасет с помощью «data.frame» и записать его в переменную.

  1. Использовать метод info().

  2. Узнать, есть ли пропущенные значения, используя isna().sum().

  3. Вывести записи, где средний возраст домов в районе более 50 лет и население более 2500 человек, используя метод loc().

  4. Узнать максимальное и минимальное значения медианной стоимости дома.

  5. Используя метод apply(), вывести на экран название признака и его среднее значение.

  6. Составить отчет о проделанной работе. В отчете должен быть представлен код и результаты его выполнения с выводами.

1.*
Дан текст на английском языке. Необходимо закодировать его с помощью азбуки Морзе, где каждой букве соответствует последовательность точек и тире. Например, буква «g» превратится в строку «--.». В переменной morze для удобства хранится словарь соответствия латинских букв коду Морзе.
morze = {'a': '.-', 'b': '-…', 'c': '-.-.', 'd': '-..',
'e': '.', 'f': '..-.', 'g': '--.', 'h': '….',
'i': '..', 'j': '.---', 'k': '-.-', 'l': '.-..',
'm': '--', 'n': '-.', 'o': '---', 'p': '.--.',
'q': '--.-', 'r': '.-.', 's': '…', 't': '-',
'u': '..-', 'v': '…-', 'w': '.--', 'x': '-..-',
'y': '-.--', 'z': '--..'}




Достарыңызбен бөлісу:
1   2   3   4   5   6   7




©engime.org 2024
әкімшілігінің қараңыз

    Басты бет