Как зайти в Даркнет?!
25th January, 01:11
5
0
Как в tkinter из поля ввода Entry получить значение в одну переменную и обновить строку кнопкой, затем получить ещё одно введённое значение и затем сложить их. Ниже пример кода
21st July, 19:00
893
0
Программа, которая создает фейковые сервера в поиске игровых серверов CS 1.6 Steam
21st March, 17:43
948
0
Очень долго работает Update запрос Oracle
27th January, 09:58
912
0
не могу запустить сервер на tomcat HTTP Status 404 – Not Found
21st January, 18:02
905
0
Где можно найти фрилансера для выполнения поступающих задач, на постоянной основе?
2nd December, 09:48
938
0
Разработка мобильной кроссплатформенной военной игры
16th July, 17:57
1724
0
период по дням
25th October, 10:44
3955
0
Пишу скрипты для BAS только на запросах
16th September, 02:42
3720
0
Некорректный скрипт для закрытия блока
14th April, 18:33
4613
0
прокидывать exception в блоках try-catch JAVA
11th March, 21:11
4381
0
Помогите пожалуйста решить задачи
24th November, 23:53
6086
0
Не понимаю почему не открывается детальное описание продукта
11th November, 11:51
4350
0
Нужно решить задачу по программированию на массивы
27th October, 18:01
4396
0
Метода Крамера С++
23rd October, 11:55
4309
0
помогите решить задачу на C++
22nd October, 17:31
4002
0
Помогите решить задачу на python с codeforces
22nd October, 11:11
4492
0
Python с нуля: полное руководство для начинающих
18th June, 13:58
2599
0
Разбор строк с разделителями?
Я смотрю на разбор разделенной строки, что-то в порядке
а,б,c
Но это очень простой пример, и разбор разделенных данных может стать сложным; например
1,"Ваш простой алгоритм, он терпит неудачу", правда
это разнесло бы вашу наивную реализацию string.Split в пух и прах. Есть ли что-нибудь, что я могу свободно use/steal/copy и вставить, что предлагает относительно пуленепробиваемое решение для разбора разделенного текста? .NET, плокс.
Update: я решил пойти с TextFieldParser, который является частью VB.NET's кучи лакомств, спрятанных в Microsoft.VisualBasic.DLL.
Я использую это для чтения из файла
string filename = @textBox1.Text;
string[] fields;
string[] delimiter = new string[] {"|"};
using (Microsoft.VisualBasic.FileIO.TextFieldParser parser =
new Microsoft.VisualBasic.FileIO.TextFieldParser(filename)) {
parser.Delimiters = delimiter;
parser.HasFieldsEnclosedInQuotes = false;
while (!parser.EndOfData) {
fields = parser.ReadFields();
//Do what you need
}
}
Я уверен, что кто-то здесь может преобразовать это в парсер строки, которая находится в памяти.
Я не знаю никаких рамок, но простая государственная машина работает:
- Состояние 1: считывайте каждый символ до тех пор, пока не нажмете a " или a ,
- В случае a ": перейти в состояние 2
- В случае a,: перейти в состояние 3
- В случае окончания файла: перейти в состояние 4
- Состояние 2: считывайте каждый символ, пока не нажмете "
- В случае a ": перейти в состояние 1
- В случае окончания файла: либо перейти в состояние 4, либо сигнализировать об ошибке из-за unterminated строки
- Состояние 3: Добавьте текущий буфер к выходному массиву, переместите курсор вперед за ним и обратно в состояние 1.
- Состояние 4: это конечное состояние, не делает ничего, кроме возврата выходного массива.
Такие как
var elements = new List<string>();
var current = new StringBuilder();
var p = 0;
while (p < internalLine.Length) {
if (internalLine[p] == '"') {
p++;
while (internalLine[p] != '"') {
current.Append(internalLine[p]);
p++;
}
// Skip past last ',
p += 2;
}
else {
while ((p < internalLine.Length) && (internalLine[p] != ',')) {
current.Append(internalLine[p]);
p++;
}
// Skip past ,
p++;
}
elements.Add(current.ToString());
current.Length = 0;
}
Лучше поздно, чем никогда (добавьте к полноте SO):
http://www.codeproject.com/KB/database/CsvReader.aspx
А вот это уже совсем другие правила.
GJ
Здесь есть несколько хороших ответов: разбить строку, игнорируя закавыченные разделы
Возможно, вы захотите перефразировать свой вопрос на что-то более точное (например, какой фрагмент кода или библиотеку я могу использовать для анализа данных CSV в .NET ?).
Чтобы сделать бесстыдный плагин, я некоторое время работал над библиотекой под названием fotelo (Formatted Text Loader), которую я использую для быстрого разбора больших объемов текста на основе разделителя, позиции или regex. Для быстрой строки это перебор, но если вы работаете с журналами или большими объемами, это может быть именно то, что вам нужно. Он работает с моделью управляющего файла, похожей на SQL*Loader (своего рода вдохновение за ним).
Я думаю, что общая структура должна была бы указывать между двумя вещами: 1. Что такое разделяющие символы? 2. При каких условиях эти символы не учитываются (например, когда они находятся между кавычками).
Я думаю, что это может быть просто лучше писать пользовательскую логику для каждого раза, когда вам нужно сделать что-то подобное.