Overview

Parameters and Specifications

Metadata

Sample Data

Sample Metadata

Sample Transcription

Request Data

Overview

Our Conversational Data in Hindi offers comprehensive and authentic dialogues of Indians conversing in Hindi. This dataset features conversations that span a wide range of topics, including daily life, business, education, and more. It includes diverse speakers from different regions of India, capturing various accents and dialects to provide a rich linguistic resource.

The data is collected from natural, spontaneous conversations to ensure authenticity, and each conversation is accurately transcribed with annotations for contextual understanding. Additionally, we offer the flexibility to tailor the topics, conversations, and scenarios according to the specific needs of your company, ensuring that the dataset aligns perfectly with your requirements.

Parameters and Specifications

Data type

Conversational, Labelled

Format

Audio - .wav (44100Hz, 16-bit)

Unique Speakers

2

Platform Hardware

Mobile Device

Audio Tracks

Individual Speaker Stems (Stereo)

Metadata

For each recording the following metadata will be available

Age of speakers

Gender

Social Background

Geographical Location

Recording Platform

Topic

Scenario

Accent

Dialect

Sample Data

Individual Speaker Stems

General Conversation

Duration: 0:00

Waveform loading... 0%

0:00
0:00
0:00
0:00
0:00
0:00
0:00
0:00
0:00
0:00
0:00

Speaker 1

Audio - .wav (44100Hz, 16-bit)

Speaker 2

Audio - .wav (44100Hz, 16-bit)

1.0

0.5

0.0

-0.5

-1.0

1.0

0.5

0.0

-0.5

-1.0

Sample Metadata

Sample Transcription

You can request below to get access to our Transcription Guidelines.

Transcription Sample

Speaker 1

27, Female, Gurugram, Haryana

[
  {
    "index": 0,
    "start_time": 2.1,
    "end_time": 3.2,
    "text": "Hi! कैसे हो?"
  },
  {
    "index": 1,
    "start_time": 5.8,
    "end_time": 9.7,
    "text": "एकदम बढ़िया, एकदम। आपके tickets हो गए बिहार जाने के? घर जाने के?"
  },
  {
    "index": 2,
    "start_time": 18.1,
    "end_time": 22.8,
    "text": "यार आप सोचो मेरा आने का ticket तो confirm हो गया है, लेकिन जाने का ticket ही confirm नहीं हो रहा है"
  },
  {
    "index": 3,
    "start_time": 23,
    "end_time": 29.3,
    "text": "मतलब समझ ही नहीं आ रहा है की कैसे जाएंगे [breathes] और flights के fare तो भाई ₹10 हज़ार से ज़्यादा हो गए है"
  },
  {
    "index": 4,
    "start_time": 29.6,
    "end_time": 30.1,
    "text": "और"
  },
  {
    "index": 5,
    "start_time": 30.4,
    "end_time": 34.5,
    "text": "waiting तो कहना ही नहीं है train में, और नया नियम आपको पता चला IRCTC का?"
  },
  {
    "index": 6,
    "start_time": 46.4,
    "end_time": 50.2,
    "text": "हाँ यार, मतलब पिछली बार तक तो waiting waiting करके भी चले गए थे, but"
  },
  {
    "index": 7,
    "start_time": 50.3,
    "end_time": 52,
    "text": "इस बार, आप गए थे पिछले बार?"
  },
  {
    "index": 8,
    "start_time": 65.5,
    "end_time": 67,
    "text": "बिल्कुल यार, मतलब "
  },
  {
    "index": 9,
    "start_time": 67.2,
    "end_time": 68,
    "text": "विदेशों तक"
  },
  {
    "index": 10,
    "start_time": 68.2,
    "end_time": 68.8,
    "text": "{kuh}"
  },
  {
    "index": 11,
    "start_time": 69.1,
    "end_time": 73.1,
    "text": "इस festival ने हमें एक नया वो दिया है identity दिलवाई है {yaa}"
  },
  {
    "index": 12,
    "start_time": 73.3,
    "end_time": 79.9,
    "text": "हमारे सभ्यता को वहां तक {uhh} पहुंचाया है, तो [breathes] मतलब definitely और मतलब ये चार दिन तो"
  },
  {
    "index": 13,
    "start_time": 80.1,
    "end_time": 86.4,
    "text": "पूरे साल [breathes] जितना अपने जन्मदिन का इंतज़ार नहीं रहता है उतना ज़्यादा इंतज़ार हमें इस festival का रहता है [breathes]"
  },
  {
    "index": 14,
    "start_time": 102.7,
    "end_time": 106.7,
    "text": "बिल्कुल, बिल्कुल मतलब वो तो है और आपके घर में कौन करता है अभी?"
  },
  {
    "index": 15,
    "start_time": 127.1,
    "end_time": 129.8,
    "text": "यार मेरे घर में तो मेरी नानी करती हैं और [breathes]"
  },
  {
    "index": 16,
    "start_time": 130,
    "end_time": 139.7,
    "text": "मतलब {uhh} दीदी करती हैं, मतलब {jit} young जितने भी लोग हैं उनकी भी रूचि बढ़ गई है और वो भी करना शुरू कर दिए हैं [breathes] तो घर का माहौल ही अलग होता है और [breathes]"
  },
  {
    "index": 17,
    "start_time": 139.8,
    "end_time": 141.8,
    "text": "हम लोग तो परवैतिन बोलते हैं न जो"
  },
  {
    "index": 18,
    "start_time": 142,
    "end_time": 143.6,
    "text": "मतलब छठ का fasting है {nuh} [breathes]"
  },
  {
    "index": 19,
    "start_time": 143.7,
    "end_time": 148.8,
    "text": "तो जब एक साथ आप दो तीन अपने घर में परवैतिन देखते हैं उनको सजे-धजे [excited] तो मतलब"
  },
  {
    "index": 20,
    "start_time": 149.1,
    "end_time": 151.3,
    "text": "क्या आनंद आता है [happy], बहुत आनंद आता है"
  },
  {
    "index": 21,
    "start_time": 163.6,
    "end_time": 164.2,
    "text": "बिल्कुल"
  },
  {
    "index": 22,
    "start_time": 172.9,
    "end_time": 177.2,
    "text": "चलिए फिर ठीक है tickets होंगे तो आप मुझे बताइएगा और मिलते हैं इस बार छठ में।"
  }
]

Speaker 2

24, Male, Gurugram, Haryana

[
  {
    "index": 0,
    "start_time": 2.9,
    "end_time": 3.3,
    "text": "Hello"
  },
  {
    "index": 1,
    "start_time": 4.6,
    "end_time": 6,
    "text": "बढ़िया आप बताओ कैसे हो? [inaudible]"
  },
  {
    "index": 2,
    "start_time": 11.3,
    "end_time": 11.7,
    "text": "नहीं"
  },
  {
    "index": 3,
    "start_time": 11.8,
    "end_time": 15.7,
    "text": "मै तो बहुत खोज रहा हूँ, ticket ही नहीं मिल रहे हैं सारे trains में waiting है, पता नहीं"
  },
  {
    "index": 4,
    "start_time": 15.9,
    "end_time": 16.4,
    "text": "कैसे"
  },
  {
    "index": 5,
    "start_time": 16.5,
    "end_time": 17.6,
    "text": "जा पाउँगा इस बार छठ"
  },
  {
    "index": 6,
    "start_time": 17.8,
    "end_time": 18.3,
    "text": "घर पे?"
  },
  {
    "index": 7,
    "start_time": 35.8,
    "end_time": 40.1,
    "text": "हाँ-हाँ नया नियम पता चल गया अब तो waiting भी लोग चढ़ नहीं सकते हैं आप bogie में"
  },
  {
    "index": 8,
    "start_time": 41.1,
    "end_time": 42.6,
    "text": "पहले जिस तरह से allow थे कि आप"
  },
  {
    "index": 9,
    "start_time": 43,
    "end_time": 44.7,
    "text": "चढ़ सकते हैं अब तो वो भी allow नहीं है।"
  },
  {
    "index": 10,
    "start_time": 53.4,
    "end_time": 54.5,
    "text": "हाँ, मैं गया था पिछली बार।"
  },
  {
    "index": 11,
    "start_time": 55,
    "end_time": 58,
    "text": "और सबसे बड़ा हमारा त्यौहार छठ ही हैं, छठ में एक अलग "
  },
  {
    "index": 12,
    "start_time": 58.6,
    "end_time": 60.2,
    "text": "महिमा बनी रहती है पूरी"
  },
  {
    "index": 13,
    "start_time": 60.5,
    "end_time": 62,
    "text": "बिहार, यूपी, झारखण्ड "
  },
  {
    "index": 14,
    "start_time": 62.3,
    "end_time": 65.1,
    "text": "आजकल तो विदेशों में लोग छठ कर रहे हैं हमारा त्यौहार"
  },
  {
    "index": 15,
    "start_time": 88.4,
    "end_time": 92.2,
    "text": "हाँ, और यह हमारा त्यौहार भी एक प्रकृति से जुड़ा एक त्यौहार है न, सूर्य "
  },
  {
    "index": 16,
    "start_time": 92.3,
    "end_time": 95.3,
    "text": "वो भगवान सूर्य को, सूर्य को हम लोग आराधना करते हैं"
  },
  {
    "index": 17,
    "start_time": 96.1,
    "end_time": 99.7,
    "text": "और सूर्य ही हमे यहाँ पे पृथ्वी पे सारी चीज़ें देता है तो ये एक"
  },
  {
    "index": 18,
    "start_time": 99.9,
    "end_time": 102.2,
    "text": "technically देखा जाए तो एक scientific भी त्यौहार है"
  },
  {
    "index": 19,
    "start_time": 108.5,
    "end_time": 110.6,
    "text": "मेरी मम्मी करती है अभी छठ त्यौहार।"
  },
  {
    "index": 20,
    "start_time": 111.6,
    "end_time": 112.8,
    "text": "मेरी मम्मी [inaudible]"
  },
  {
    "index": 21,
    "start_time": 113,
    "end_time": 116.9,
    "text": "मेरी मम्मी को मेरी दादी ने दिआ था, यह तो परंपरा होती है न कि आप अपने [inaudible]"
  },
  {
    "index": 22,
    "start_time": 117,
    "end_time": 118.7,
    "text": "बहु को देते हैं यह त्यौहार"
  },
  {
    "index": 23,
    "start_time": 119.2,
    "end_time": 123.3,
    "text": "तो यह परंपरा चलती है और यह परंपरा से भी एक लगता है की आने वाली पीढ़ी के लिए ये एक"
  },
  {
    "index": 24,
    "start_time": 123.8,
    "end_time": 126.1,
    "text": "{uhh} compulsory हो गया है की यह त्यौहार करना ही है।"
  },
  {
    "index": 25,
    "start_time": 143.2,
    "end_time": 144.1,
    "text": "{hmm} {hmm} {hmm} {hmm}"
  },
  {
    "index": 26,
    "start_time": 152.9,
    "end_time": 153.7,
    "text": "और पूरा"
  },
  {
    "index": 27,
    "start_time": 153.9,
    "end_time": 158.6,
    "text": "एक जो आपकी colony होती है वो पूरा colony ही ऐसा माहौल हो जाता है लगता है कि एक"
  },
  {
    "index": 28,
    "start_time": 159.2,
    "end_time": 163.6,
    "text": "{umm} त्यौहार में आ चुके हैं और त्यौहार भी लम्बा चल रहा है, चार दिनों का लम्बा त्यौहार है "
  },
  {
    "index": 29,
    "start_time": 164.5,
    "end_time": 165,
    "text": "और"
  },
  {
    "index": 30,
    "start_time": 165.3,
    "end_time": 170.9,
    "text": "आस पास के लोग, दूसरे धर्म के भी लोग होते है वो भी हमारी मदद करते है इस त्यौहार में, यह ऐसा त्यौहार ही है"
  },
  {
    "index": 31,
    "start_time": 178.7,
    "end_time": 179.6,
    "text": "बिल्कुल, बिल्कुल "
  },
  {
    "index": 32,
    "start_time": 180,
    "end_time": 180.4,
    "text": "ठीक है"
  }
]

Request Data

You can file a request to get access to the data.