<MyRusakov.ru />

Профессия Web-разработчик

Профессия Web-разработчик

Этот комплект за 8 месяцев превратит Вас в Web-разработчика с нуля. Учиться достаточно 1 час в день.

Начнёте Вы с HTML, CSS и вёрстки сайтов. Потом перейдёте к программированию и JavaScript. Затем изучите PHP, MySQL, SQL, Python. Изучите Web-фреймворки Laravel и Django. Создадите 5 своих сайтов для портфолио.

Комплект содержит:

- 540 видеоуроков

- 110 часов видео

- 1205 заданий для закрепления материала из уроков

- 5 финальных тестов

- 7 сертификатов

- 12 Бонусных курсов

Подробнее
Подписка

Подпишитесь на мой канал на YouTube, где я регулярно публикую новые видео.

YouTube Подписаться

Подписавшись по E-mail, Вы будете получать уведомления о новых статьях.

Подписка Подписаться

Добавляйтесь ко мне в друзья ВКонтакте! Отзывы о сайте и обо мне оставляйте в моей группе.

Мой аккаунт Мой аккаунт Моя группа
Опрос

Какая тема Вас интересует больше?

Как прочитать docx файл в C#?

Как прочитать docx файл в C#?

Формат .docx является стандартным форматом документов Microsoft Word, основанным на XML. Для его чтения в среде .NET рекомендуется использовать библиотеку Open XML SDK, которая предоставляет высокоуровневый доступ к структуре документов Office Open XML*.

Требования

Перед началом работы необходимо установить пакет DocumentFormat.OpenXml. Это можно сделать с помощью NuGet:

Install-Package DocumentFormat.OpenXml

Или через .NET CLI:

dotnet add package DocumentFormat.OpenXml

Пример: чтение текста из *.docx файла

Ниже приведён пример чтения текста из документа Word:

using System;
using DocumentFormat.OpenXml.Packaging;
using DocumentFormat.OpenXml.Wordprocessing;
using System.Text;

class Program
{
    static void Main(string[] args)
    {
        string filePath = "example.docx";
        string documentText = ReadWordDocument(filePath);
        Console.WriteLine(documentText);
    }

    static string ReadWordDocument(string path)
    {
        StringBuilder textBuilder = new StringBuilder();

        using (WordprocessingDocument wordDoc = WordprocessingDocument.Open(path, false))
        {
            Body body = wordDoc.MainDocumentPart.Document.Body;

            foreach (var paragraph in body.Elements<Paragraph>())
            {
                textBuilder.AppendLine(paragraph.InnerText);
            }
        }

        return textBuilder.ToString();
    }
}

Объяснение кода:

  • WordprocessingDocument.Open(path, false) — открывает документ в режиме только для чтения.
  • MainDocumentPart.Document.Body — доступ к основному содержимому документа.
  • paragraph.InnerText — получение текста каждого абзаца.

Работа с таблицами и другими элементами

Если документ содержит таблицы, изображения или другие элементы, необходимо использовать соответствующие классы из пространства имён DocumentFormat.OpenXml.Wordprocessing.

Пример чтения текста из таблиц:

foreach (Table table in body.Elements<Table>())
{
    foreach (TableRow row in table.Elements<TableRow>())
    {
        foreach (TableCell cell in row.Elements<TableCell>())
        {
            Console.Write(cell.InnerText + "\t");
        }
        Console.WriteLine();
    }
}

Альтернативные библиотеки

Для более простого доступа к содержимому *.docx файлов можно использовать сторонние библиотеки, например:

  • DocX (от Xceed): простой и интуитивный API.
  • Spire.Doc for .NET: платная, но мощная библиотека с поддержкой расширенного форматирования и экспорта.

Пример с использованием Xceed.Words.NET (DocX):

using Xceed.Words.NET;

class Program
{
    static void Main()
    {
        using (DocX document = DocX.Load("example.docx"))
        {
            Console.WriteLine(document.Text);
        }
    }
}

Установка:

Install-Package Xceed.Words.NET

Для чтения .docx файлов в C# можно использовать как стандартную библиотеку Open XML SDK*, так и сторонние решения. Выбор зависит от требований к функциональности и удобству работы с форматом документа.

Если вам нужно работать с большими документами, учитывать форматирование или изменять содержимое, рекомендуется использовать Open XML SDK совместно с вспомогательными библиотеками или абстракциями.

Копирование материалов разрешается только с указанием автора (Михаил Русаков) и индексируемой прямой ссылкой на сайт (http://myrusakov.ru)!

Добавляйтесь ко мне в друзья ВКонтакте: http://vk.com/myrusakov.
Если Вы хотите дать оценку мне и моей работе, то напишите её в моей группе: http://vk.com/rusakovmy.

Если Вы не хотите пропустить новые материалы на сайте,
то Вы можете подписаться на обновления: Подписаться на обновления

Если у Вас остались какие-либо вопросы, либо у Вас есть желание высказаться по поводу этой статьи, то Вы можете оставить свой комментарий внизу страницы.

Порекомендуйте эту статью друзьям:

Если Вам понравился сайт, то разместите ссылку на него (у себя на сайте, на форуме, в контакте):

  1. Кнопка:

    Она выглядит вот так: Как создать свой сайт

  2. Текстовая ссылка:

    Она выглядит вот так: Как создать свой сайт

  3. BB-код ссылки для форумов (например, можете поставить её в подписи):

Комментарии (0):

Для добавления комментариев надо войти в систему.
Если Вы ещё не зарегистрированы на сайте, то сначала зарегистрируйтесь.