0% found this document useful (0 votes)

21 views3 pages

Pandas Interview Questions PowerBI SQL

The document presents a series of Pandas interview questions with real-time scenarios relevant to Power BI and SQL. Each scenario includes a question and a corresponding code solution using Pandas for tasks such as data preprocessing, SQL query replication, dataset merging, time intelligence calculations, and handling large datasets. It also covers automating data transformation from Excel to SQL, demonstrating practical applications of Pandas in data analysis and manipulation.

Uploaded by

verma.anil0509

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

21 views3 pages

Pandas Interview Questions PowerBI SQL

Uploaded by

verma.anil0509

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

You are on page 1/ 3

Pandas Interview Questions with Real-time Scenarios for Power BI and SQL

1. Scenario: Data Preprocessing before Power BI Import

Q: You're working with a CSV dataset that contains sales data. Some rows have missing values in the ProductName

and Revenue columns. Before importing into Power BI, how would you handle this using Pandas?

import pandas as pd

df = pd.read_csv('sales.csv')

df = df[df['ProductName'].notna()]

df['Revenue'] = df['Revenue'].fillna(0)

2. Scenario: SQL to Pandas Conversion

Q: You have this SQL query:

SELECT Region, SUM(SalesAmount) FROM Sales GROUP BY Region HAVING SUM(SalesAmount) > 10000

How would you replicate it in Pandas?

df_grouped = df.groupby('Region')['SalesAmount'].sum().reset_index()

df_filtered = df_grouped[df_grouped['SalesAmount'] > 10000]

3. Scenario: Merging Datasets like SQL Joins

Q: You have two dataframes: orders and customers. How would you perform a LEFT JOIN in Pandas?

df_joined = pd.merge(orders, customers, how='left', on='CustomerID')

4. Scenario: Time Intelligence like DAX

Q: How would you calculate YoY Sales using Pandas?

df['OrderDate'] = pd.to_datetime(df['OrderDate'])

df['Year'] = df['OrderDate'].dt.year

df['Month'] = df['OrderDate'].dt.month

monthly_sales = df.groupby(['Year', 'Month'])['Sales'].sum().reset_index()

monthly_sales['Sales_PY'] = monthly_sales['Sales'].shift(12)

monthly_sales['YoY_Growth'] = ((monthly_sales['Sales'] - monthly_sales['Sales_PY']) / monthly_sales['Sales_PY']) * 100

5. Scenario: Handling Large Datasets like Fact Tables

Q: You have a large dataset (10 million rows) in CSV format. What Pandas techniques would you use?

chunks = pd.read_csv('large_sales.csv', chunksize=500000)

filtered_chunks = []

for chunk in chunks:

chunk = chunk[chunk['Sales'] > 1000]

filtered_chunks.append(chunk)

df_filtered = pd.concat(filtered_chunks)

6. Scenario: Replace Calculated Columns in Power BI with Pandas

Q: How would you calculate Profit Margin?

df['ProfitMargin'] = (df['Revenue'] - df['Cost']) / df['Revenue']

7. Scenario: Automating Excel/CSV to Power BI Pipeline

Q: How would you clean and transform data from Excel sheets and push to SQL?

all_sheets = pd.read_excel('sales_data.xlsx', sheet_name=None)

combined = pd.concat(all_sheets.values(), ignore_index=True)

combined['Revenue'] = combined['Revenue'].fillna(0)

combined['Date'] = pd.to_datetime(combined['Date'])

from sqlalchemy import create_engine

engine = create_engine('mssql+pyodbc://server/db?driver=SQL+Server')

combined.to_sql('SalesCleaned', con=engine, if_exists='replace')

Data Cleaning - Cheatsheet
100% (2)
Data Cleaning - Cheatsheet
8 pages
Resource - Python Cheat Sheets - Python Programming With Sequences of Data - Y9
No ratings yet
Resource - Python Cheat Sheets - Python Programming With Sequences of Data - Y9
8 pages
Knowledge Pillars Code Questions
No ratings yet
Knowledge Pillars Code Questions
46 pages
NumPy Interview Questions PowerBI SQL
No ratings yet
NumPy Interview Questions PowerBI SQL
3 pages
Deloite Data Engineer Interview Questions
No ratings yet
Deloite Data Engineer Interview Questions
24 pages
Recently Asked Data Analyst Interview Questions
No ratings yet
Recently Asked Data Analyst Interview Questions
4 pages
Python Unit 2 Question Bank
No ratings yet
Python Unit 2 Question Bank
5 pages
Deloitte Data Engineer Interview Experience (0-3 Yoe)
No ratings yet
Deloitte Data Engineer Interview Experience (0-3 Yoe)
22 pages
SQL Python PowerBI Questions and Answers
No ratings yet
SQL Python PowerBI Questions and Answers
4 pages
MY Question Bank
100% (1)
MY Question Bank
3 pages
Python Data Insights Using Pandas Interview Q&A
No ratings yet
Python Data Insights Using Pandas Interview Q&A
5 pages
Python Scenario Based Interview QA
No ratings yet
Python Scenario Based Interview QA
3 pages
Python Questions BA
No ratings yet
Python Questions BA
5 pages
Pandas Roadmap
No ratings yet
Pandas Roadmap
6 pages
DevOps Session 3 Pandas
No ratings yet
DevOps Session 3 Pandas
33 pages
Unit-II Data Science QB
No ratings yet
Unit-II Data Science QB
33 pages
50 Common Data Analyst Interview Questions
No ratings yet
50 Common Data Analyst Interview Questions
3 pages
Python Interview Questions For Data Analytics
No ratings yet
Python Interview Questions For Data Analytics
2 pages
Python Interview Questions by Skill Arbitrage
No ratings yet
Python Interview Questions by Skill Arbitrage
3 pages
Recently Asked Data Analyst Interview Questions-2
No ratings yet
Recently Asked Data Analyst Interview Questions-2
4 pages
Walmart Data Analyst Interview Experience
No ratings yet
Walmart Data Analyst Interview Experience
10 pages
Pandas Introduction: What Is Python Pandas Used For?
No ratings yet
Pandas Introduction: What Is Python Pandas Used For?
28 pages
Every Data Analyst Should Know !
No ratings yet
Every Data Analyst Should Know !
4 pages
HCLTech
No ratings yet
HCLTech
5 pages
Pandas
No ratings yet
Pandas
26 pages
Lab 1 ML Lab
No ratings yet
Lab 1 ML Lab
15 pages
Python Interviews
No ratings yet
Python Interviews
154 pages
Pandas Tutorial
No ratings yet
Pandas Tutorial
9 pages
MCQ
No ratings yet
MCQ
8 pages
Top 50 Industry-Relevant Data Analyst Interview Q - A
No ratings yet
Top 50 Industry-Relevant Data Analyst Interview Q - A
5 pages
Practical File Infomatics Practices 2024-25
No ratings yet
Practical File Infomatics Practices 2024-25
39 pages
Dataframe in Pandas - Cheatsheet
No ratings yet
Dataframe in Pandas - Cheatsheet
8 pages
Python - Pandas - Numpy Interview Q&A
No ratings yet
Python - Pandas - Numpy Interview Q&A
12 pages
Prac 1
No ratings yet
Prac 1
5 pages
Deloitee Data Engineer Interview Questions
No ratings yet
Deloitee Data Engineer Interview Questions
24 pages
Python MCQs
No ratings yet
Python MCQs
21 pages
Pandas Notes
No ratings yet
Pandas Notes
8 pages
Python Pandas
No ratings yet
Python Pandas
15 pages
Questions For Preparation
No ratings yet
Questions For Preparation
9 pages
EDA With Pandas
No ratings yet
EDA With Pandas
8 pages
Common Python Data Science Interview Questions1
No ratings yet
Common Python Data Science Interview Questions1
5 pages
45 Important Pandas Function
No ratings yet
45 Important Pandas Function
15 pages
Module 4
No ratings yet
Module 4
38 pages
Data Wrangling With Python and Pandas
No ratings yet
Data Wrangling With Python and Pandas
7 pages
Unit Ii 2M
No ratings yet
Unit Ii 2M
8 pages
Pandas Fuction Notes
No ratings yet
Pandas Fuction Notes
3 pages
Python Pandas Tutorial For Beginners
No ratings yet
Python Pandas Tutorial For Beginners
203 pages
learnPandas
No ratings yet
learnPandas
37 pages
Mastering Data Analyst Interview Scenarios
No ratings yet
Mastering Data Analyst Interview Scenarios
20 pages
100 Real World Python Problem
No ratings yet
100 Real World Python Problem
7 pages
Day 3 - Notes Interview Questions
No ratings yet
Day 3 - Notes Interview Questions
36 pages
CO3 - 3 - Indexing and Sorting, Loading Data From CSV
No ratings yet
CO3 - 3 - Indexing and Sorting, Loading Data From CSV
29 pages
What Is Pandas
No ratings yet
What Is Pandas
9 pages
Loki Temp PPT Pandas 2
No ratings yet
Loki Temp PPT Pandas 2
31 pages
Python Pandas Tutorial - The Ultimate Guide For Beginner
No ratings yet
Python Pandas Tutorial - The Ultimate Guide For Beginner
32 pages
Razorpay Data Analyst Interview Questions 1739977522
No ratings yet
Razorpay Data Analyst Interview Questions 1739977522
12 pages
Pandas Notes
No ratings yet
Pandas Notes
6 pages
Pandas Tutorial
No ratings yet
Pandas Tutorial
1 page
Pandas Interview Question
No ratings yet
Pandas Interview Question
3 pages
Python Data Science 101
100% (1)
Python Data Science 101
41 pages
Microsoft Azure Database Administrator DP 300
From Everand
Microsoft Azure Database Administrator DP 300
Manish Soni
No ratings yet
Administering Microsoft Azure SQL Solutions DP 300
From Everand
Administering Microsoft Azure SQL Solutions DP 300
Manish Soni
No ratings yet
VHDL-Unit-2-Part-5 1
No ratings yet
VHDL-Unit-2-Part-5 1
92 pages
Practice - Assignment - For - SystemVerilog
No ratings yet
Practice - Assignment - For - SystemVerilog
2 pages
(Paul Cardle) Android App Development in Android S (B-Ok - Xyz) PDF
No ratings yet
(Paul Cardle) Android App Development in Android S (B-Ok - Xyz) PDF
202 pages
Ch. 5 Object Oriented Programming in Python
100% (1)
Ch. 5 Object Oriented Programming in Python
19 pages
Device Tree Overview
No ratings yet
Device Tree Overview
23 pages
Topics: - Expert System Components - Expert Systems Development - Virtual Reality
No ratings yet
Topics: - Expert System Components - Expert Systems Development - Virtual Reality
29 pages
Fortran77 Programming Reference Manual
No ratings yet
Fortran77 Programming Reference Manual
418 pages
07 Hadoop（源码解析）V3.3
No ratings yet
07 Hadoop（源码解析）V3.3
81 pages
Chapter Introduction
No ratings yet
Chapter Introduction
38 pages
OOPS in Automation Framework
No ratings yet
OOPS in Automation Framework
3 pages
LAB211Assignment: Title Background Program Specifications
No ratings yet
LAB211Assignment: Title Background Program Specifications
2 pages
Comp300 Finals
No ratings yet
Comp300 Finals
3 pages
Zohaib's Resume
No ratings yet
Zohaib's Resume
1 page
Computer Aided Design For Vlsi
No ratings yet
Computer Aided Design For Vlsi
4 pages
Latest Log
No ratings yet
Latest Log
554 pages
cs309 Asgn1-1
No ratings yet
cs309 Asgn1-1
2 pages
Introduction To OOALV
No ratings yet
Introduction To OOALV
20 pages
Moblie Application Deveopment
No ratings yet
Moblie Application Deveopment
66 pages
Unit 4 FPL
No ratings yet
Unit 4 FPL
25 pages
ArjunKrishna QA AutomationLead
No ratings yet
ArjunKrishna QA AutomationLead
2 pages
Designing and Implementing A Computerized Grading System Using HTML For The Front End
No ratings yet
Designing and Implementing A Computerized Grading System Using HTML For The Front End
6 pages
Control Arrays in Visual Basic 6.0: Sharing Event Handlers
No ratings yet
Control Arrays in Visual Basic 6.0: Sharing Event Handlers
4 pages
Board Question C Program Solve
No ratings yet
Board Question C Program Solve
33 pages
Mod - Job Submission From CICS
100% (2)
Mod - Job Submission From CICS
19 pages
Assignment 4
No ratings yet
Assignment 4
7 pages
Deleting A Node at The Beginning
No ratings yet
Deleting A Node at The Beginning
4 pages
Computer Unit Test Paper 2
No ratings yet
Computer Unit Test Paper 2
2 pages
Assignment-DAA 1
No ratings yet
Assignment-DAA 1
4 pages

Pandas Interview Questions PowerBI SQL

Uploaded by

Pandas Interview Questions PowerBI SQL

Uploaded by

Pandas Interview Questions with Real-time Scenarios for Power BI and SQL

1. Scenario: Data Preprocessing before Power BI Import

2. Scenario: SQL to Pandas Conversion

Q: You have this SQL query:

How would you replicate it in Pandas?

df_filtered = df_grouped[df_grouped['SalesAmount'] > 10000]

3. Scenario: Merging Datasets like SQL Joins

df_joined = pd.merge(orders, customers, how='left', on='CustomerID')

4. Scenario: Time Intelligence like DAX

Q: How would you calculate YoY Sales using Pandas?

monthly_sales = df.groupby(['Year', 'Month'])['Sales'].sum().reset_index()

monthly_sales['YoY_Growth'] = ((monthly_sales['Sales'] - monthly_sales['Sales_PY']) / monthly_sales['Sales_PY']) * 100

5. Scenario: Handling Large Datasets like Fact Tables

chunks = pd.read_csv('large_sales.csv', chunksize=500000)

for chunk in chunks:

chunk = chunk[chunk['Sales'] > 1000]

6. Scenario: Replace Calculated Columns in Power BI with Pandas

Q: How would you calculate Profit Margin?

df['ProfitMargin'] = (df['Revenue'] - df['Cost']) / df['Revenue']

7. Scenario: Automating Excel/CSV to Power BI Pipeline

all_sheets = pd.read_excel('sales_data.xlsx', sheet_name=None)

from sqlalchemy import create_engine

combined.to_sql('SalesCleaned', con=engine, if_exists='replace')

You might also like