AI4Bharat IndicHeadlineGeneration (mr)

MH Specific

AI4Bharat IndicHeadlineGeneration (mr) dataset for language nlp.

Build an automatic Marathi headline generator for news aggregation platforms to create concise, accurate headlines from article text.

Homepage HuggingFace

Quick Start

from datasets import load_dataset
ds = load_dataset('ai4bharat/IndicHeadlineGeneration', 'mr', split='train', streaming=True)
for i, ex in enumerate(ds):
    print(f"Headline: {ex['headline'][:60]}")
    print(f"Article: {ex['text'][:80]}...\n")
    if i >= 4: break

Modality

text

Size

114,042 train + 14,253 dev + 14,340 test

License

CC-BY-NC-4.0

Format

CSV/JSON

Language

Update Frequency

static

Organization