✅ PART 1- Install Java and Hadoop on Ubuntu

This document provides a step-by-step guide to install Java and Hadoop on Ubuntu, configure environment variables, and write a WordCount Java program. It includes instructions for compiling the program, creating a JAR file, and running a MapReduce job to count word occurrences in a text file. The final output displays the count of each word processed by the job.

Uploaded by

ayeshagujrati00

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

0% found this document useful (0 votes)

4 views

✅ PART 1- Install Java and Hadoop on Ubuntu

Uploaded by

ayeshagujrati00

We take content rights seriously. If you suspect this is your content, claim it here.

Available Formats

Download as PDF, TXT or read online on Scribd

You are on page 1/ 4

✅ PART 1: Install Java and Hadoop on Ubuntu

🧰 Step 1: Install Java (JDK)

sudo apt update
sudo apt install openjdk-11-jdk -y
java -version

📦 Step 2: Download and Configure Hadoop (Standalone Mode)

🔽 Download Hadoop
cd ~
wget https://downloads.apache.org/hadoop/common/hadoop-3.3.6/hadoop-3.3.6.tar.gz
tar -xzf hadoop-3.3.6.tar.gz
mv hadoop-3.3.6 hadoop

🔧 Set Environment Variables

Edit ~/.bashrc:

nano ~/.bashrc

Add these at the end:

export HADOOP_HOME=~/hadoop
export PATH=$PATH:$HADOOP_HOME/bin
export JAVA_HOME=/usr/lib/jvm/java-11-openjdk-amd64
export HADOOP_CLASSPATH=$JAVA_HOME/lib/tools.jar

Apply the changes:

source ~/.bashrc

✅ Test:
hadoop version

✅ PART 2: Write the WordCount Java Code

Create a folder and Java file:

mkdir ~/wordcount
cd ~/wordcount
nano WordCount.java

import java.io.IOException;
import java.util.StringTokenizer;
import org.apache.hadoop.conf.Configuration;
import org.apache.hadoop.fs.Path;
import org.apache.hadoop.io.IntWritable;
import org.apache.hadoop.io.Text;
import org.apache.hadoop.mapreduce.Job;
import org.apache.hadoop.mapreduce.Mapper;
import org.apache.hadoop.mapreduce.Reducer;
import org.apache.hadoop.mapreduce.lib.input.FileInputFormat;
import org.apache.hadoop.mapreduce.lib.output.FileOutputFormat;

public class WordCount {

public static class TokenizerMapper

extends Mapper<Object, Text, Text, IntWritable> {
private final static IntWritable one = new IntWritable(1);
private Text word = new Text();
public void map(Object key, Text value, Context context)
throws IOException, InterruptedException {
StringTokenizer itr = new StringTokenizer(value.toString());
while (itr.hasMoreTokens()) {
word.set(itr.nextToken());
context.write(word, one);
}
}
}

public static class IntSumReducer

extends Reducer<Text,IntWritable,Text,IntWritable> {
private IntWritable result = new IntWritable();
public void reduce(Text key, Iterable<IntWritable> values,
Context context) throws IOException, InterruptedException {
int sum = 0;
for (IntWritable val : values) {
sum += val.get();
}
result.set(sum);
context.write(key, result);
}
}

public static void main(String[] args) throws Exception {

Configuration conf = new Configuration();
Job job = Job.getInstance(conf, "word count");
job.setJarByClass(WordCount.class);
job.setMapperClass(TokenizerMapper.class);
job.setCombinerClass(IntSumReducer.class);
job.setReducerClass(IntSumReducer.class);
job.setOutputKeyClass(Text.class);
job.setOutputValueClass(IntWritable.class);
FileInputFormat.addInputPath(job, new Path(args[0]));
FileOutputFormat.setOutputPath(job, new Path(args[1]));
System.exit(job.waitForCompletion(true) ? 0 : 1);
}
}

✅ PART 3: Compile and Run the Program

🔧 Step 1: Compile
mkdir classes
javac -classpath
"$HADOOP_HOME/share/hadoop/common/*:$HADOOP_HOME/share/hadoop/mapreduce/*" -d
classes WordCount.java

📦 Step 2: Create a JAR

jar -cvf wordcount.jar -C classes/ .

✅ PART 4: Run WordCount Job (Standalone)

📁 Step 1: Create Input File
mkdir input
echo "hadoop mapreduce hadoop word count word count" > input/test.txt

▶️ Step 2: Run MapReduce Job

hadoop jar wordcount.jar WordCount input output

📄 Step 3: View Output

cat output/part-r-00000

count 2
hadoop 2
mapreduce 1
word 2

Dynamic Approval Group
100% (1)
Dynamic Approval Group
40 pages
To Count Using Map and Reduce Program: Wordcount - Java
No ratings yet
To Count Using Map and Reduce Program: Wordcount - Java
2 pages
Wordcount
No ratings yet
Wordcount
3 pages
Word Count Program
No ratings yet
Word Count Program
2 pages
049
No ratings yet
049
2 pages
Practical 3bcbs
No ratings yet
Practical 3bcbs
5 pages
1WordCount
No ratings yet
1WordCount
2 pages
Run Wordcount
No ratings yet
Run Wordcount
3 pages
Hadoop WordCount
No ratings yet
Hadoop WordCount
2 pages
Word Count Program
No ratings yet
Word Count Program
3 pages
Word Count Example
No ratings yet
Word Count Example
4 pages
WordCount Program Hadoop Task 2
No ratings yet
WordCount Program Hadoop Task 2
7 pages
Practical 2c
No ratings yet
Practical 2c
2 pages
02-Wordcount Mapreduce
No ratings yet
02-Wordcount Mapreduce
5 pages
Word Count Program To Demonstrate The Use of Map and Reduce Tasks
No ratings yet
Word Count Program To Demonstrate The Use of Map and Reduce Tasks
5 pages
ExNo04
No ratings yet
ExNo04
4 pages
Experiment-4 BDA LAB
No ratings yet
Experiment-4 BDA LAB
7 pages
Part B Assignment - No - 1
No ratings yet
Part B Assignment - No - 1
6 pages
BDC Output 3
No ratings yet
BDC Output 3
4 pages
579 BDA Week-04
No ratings yet
579 BDA Week-04
1 page
Exp-11
No ratings yet
Exp-11
4 pages
Experiment 6 BDA
No ratings yet
Experiment 6 BDA
4 pages
Codigo Haddop
No ratings yet
Codigo Haddop
3 pages
Source Code for Wordcount
No ratings yet
Source Code for Wordcount
3 pages
Big Data Practical 2
No ratings yet
Big Data Practical 2
11 pages
Ravikant_Hadoop_file
No ratings yet
Ravikant_Hadoop_file
22 pages
Bdt Lab 6 22mis1067
No ratings yet
Bdt Lab 6 22mis1067
13 pages
Exp 3-Word Count
No ratings yet
Exp 3-Word Count
4 pages
11. WordCountApp
No ratings yet
11. WordCountApp
2 pages
Word Count Example
No ratings yet
Word Count Example
4 pages
Ravinder Big Data 4 PDF
No ratings yet
Ravinder Big Data 4 PDF
15 pages
ContarPalabras Java
No ratings yet
ContarPalabras Java
2 pages
Map Reduce Example
No ratings yet
Map Reduce Example
6 pages
ADA Lab Manual
No ratings yet
ADA Lab Manual
34 pages
Steps: /usr/lib/hadoop-0.20/ Usr/lib/hadoop-0.20/lib
No ratings yet
Steps: /usr/lib/hadoop-0.20/ Usr/lib/hadoop-0.20/lib
4 pages
BDF Programs
No ratings yet
BDF Programs
32 pages
CTBD Sol02
No ratings yet
CTBD Sol02
2 pages
BDA3
No ratings yet
BDA3
7 pages
Word Count Program With MapReduce and Java
No ratings yet
Word Count Program With MapReduce and Java
6 pages
Word Count Program With MapReduce and Java
No ratings yet
Word Count Program With MapReduce and Java
6 pages
Classcreation
No ratings yet
Classcreation
2 pages
Lab3_BigData-MapReduce
No ratings yet
Lab3_BigData-MapReduce
8 pages
Dsa Prac 5 19DCS038
No ratings yet
Dsa Prac 5 19DCS038
16 pages
Map Reduce Java Program
No ratings yet
Map Reduce Java Program
2 pages
Map Reduce
No ratings yet
Map Reduce
4 pages
Running Jar Program
No ratings yet
Running Jar Program
3 pages
6 - Simple Wordcount
No ratings yet
6 - Simple Wordcount
2 pages
BDA
No ratings yet
BDA
6 pages
3 MapReduce program ex code
No ratings yet
3 MapReduce program ex code
14 pages
wc
No ratings yet
wc
13 pages
Steps to create jar file and execute word count problem in mapper reducer
No ratings yet
Steps to create jar file and execute word count problem in mapper reducer
5 pages
DA Lab Program-2
No ratings yet
DA Lab Program-2
6 pages
DSBDA 11
No ratings yet
DSBDA 11
15 pages
Palak
No ratings yet
Palak
10 pages
Import Import Import Import Import Import Import Import Public Class Extends Implements
No ratings yet
Import Import Import Import Import Import Import Import Public Class Extends Implements
7 pages
Exp 4 Word Count
No ratings yet
Exp 4 Word Count
4 pages
Core Java Programming Book
From Everand
Core Java Programming Book
Manish Soni
No ratings yet
Example - (Map Function in Word Count)
No ratings yet
Example - (Map Function in Word Count)
6 pages
DSBDA GRP B Print
No ratings yet
DSBDA GRP B Print
21 pages
Tutorial-Counting Words in File (S) Using Mapreduce: Prerequisites
No ratings yet
Tutorial-Counting Words in File (S) Using Mapreduce: Prerequisites
11 pages
50 Recipes for Programming Node.js
From Everand
50 Recipes for Programming Node.js
Jamie Munro
3/5 (4)
IS2104 CourseHandout
No ratings yet
IS2104 CourseHandout
7 pages
Angular Js Developer
No ratings yet
Angular Js Developer
3 pages
4-Object Oriented in PHP PDF
No ratings yet
4-Object Oriented in PHP PDF
16 pages
Visual Basic Part 4 Studocu PDF
No ratings yet
Visual Basic Part 4 Studocu PDF
42 pages
Python - Gui Programming (Tkinter)
No ratings yet
Python - Gui Programming (Tkinter)
33 pages
Learning Modern C++ for Finance: Foundations for Quantitative Programming (Fourth Early Release) 4th Edition Daniel Hanson pdf download
100% (1)
Learning Modern C++ for Finance: Foundations for Quantitative Programming (Fourth Early Release) 4th Edition Daniel Hanson pdf download
71 pages
Flutter Dart
No ratings yet
Flutter Dart
41 pages
AVHDL
No ratings yet
AVHDL
183 pages
Unit4 PHP
No ratings yet
Unit4 PHP
12 pages
Kaushik Khambhadiya Resume
No ratings yet
Kaushik Khambhadiya Resume
2 pages
Experiment No: 2 Pig Latin Commands Aim
No ratings yet
Experiment No: 2 Pig Latin Commands Aim
7 pages
Chapter Four: Communication in Distributed Systems
No ratings yet
Chapter Four: Communication in Distributed Systems
26 pages
Topic 1 - Designing Basic Controls or Objects
No ratings yet
Topic 1 - Designing Basic Controls or Objects
14 pages
Objectoriented Programming With Visual Basicnet Michael Mcmillan download
100% (1)
Objectoriented Programming With Visual Basicnet Michael Mcmillan download
82 pages
Risk Management System
No ratings yet
Risk Management System
12 pages
Ublock Statik Filtrelerim - 2023 08 08 - 08.59.41
No ratings yet
Ublock Statik Filtrelerim - 2023 08 08 - 08.59.41
741 pages
Lab Guide - PDF - EN
No ratings yet
Lab Guide - PDF - EN
174 pages
Chapter 1 Eng Getting Started With Python
No ratings yet
Chapter 1 Eng Getting Started With Python
19 pages
Pharmaceutical and Software Development Projects
No ratings yet
Pharmaceutical and Software Development Projects
6 pages
Hunt For Threats Using The Microsoft Sentinel Portal Slides
No ratings yet
Hunt For Threats Using The Microsoft Sentinel Portal Slides
32 pages
AZ-104 Official Course Study Guide
No ratings yet
AZ-104 Official Course Study Guide
23 pages
Jaas in Action - Chapter06 02
No ratings yet
Jaas in Action - Chapter06 02
15 pages
Xprint - Vpxprint
No ratings yet
Xprint - Vpxprint
330 pages
7 Steps To Advance Software Developer Career
No ratings yet
7 Steps To Advance Software Developer Career
9 pages
Resume Pratish Katiyar
No ratings yet
Resume Pratish Katiyar
1 page
C++ Syllabus 2
No ratings yet
C++ Syllabus 2
6 pages
Quiz Questions - MS POWERPOINT
No ratings yet
Quiz Questions - MS POWERPOINT
14 pages
302
No ratings yet
302
46 pages
Iq and Interest Finding System: Undertaken by
No ratings yet
Iq and Interest Finding System: Undertaken by
44 pages