ВУЗ: Не указан

Категория: Не указан

Дисциплина: Не указана

Добавлен: 06.04.2021

Просмотров: 2163

Скачиваний: 4

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.
background image

135

g

(

ζ

)

C

0

[0

,

)

C

1

[

a, b

]

C

2

(

a, b

)

, удовлетворяющую дополнительным условиям

g

(

ζ

) =

ζ,

ζ

[0

, a

]

[

b,

);

g

0

(

ζ

)

>

0

,

a

6

ζ

6

b.

(7)

то она будет порождать в области

Ω =

{

(

ζ, θ, ϕ

) :

a < ζ < b

}

анизотропную и

неоднородную акустическую среду с параметрами

ˆ

ρ

1

,

ˆ

ρ

2

и

ˆ

λ

, определяемыми по

функции

g

формулами

ˆ

ρ

1

(

ζ

) =

1

g

0

(

ζ

)

,

ˆ

ρ

2

(

ζ

) =

ζ

2

g

0

(

ζ

)

g

2

(

ζ

)

,

ˆ

λ

(

ζ

) =

ζ

2

g

2

(

ζ

)

g

0

(

ζ

)

,

ζ

[

a, b

]

.

(8)

Таким условиям (3) удовлетворяет, например, функция

g

(

ζ

) =

(

ζ,

ζ

[0

, a

]

[

b,

)

,

c

1

+

c

2

ζ

2

,

a

6

ζ

6

b,

где

c

1

=

ab

a

+

b

,

c

2

=

1

a

+

b

,

Отвечающая данной среде оболочка

(Ω

,

ˆ

ρ

1

,

ˆ

ρ

2

,

ˆ

λ

)

не изменяет во внешности

e

пада-

ющее поле давлений

p

inc

, создаваемое любым допустимым источником

(

Q, f

)

F

ad

,

где

f

∈ D

0

0

(

R

3

; Ω

e

)

– произвольная обобщенная функция с носителем

Q

supp

f

,

расположенным в

e

. Это означает, что построенная указанным образом оболочка

(Ω

,

ˆ

ρ

1

,

ˆ

ρ

2

,

ˆ

λ

)

не рассеивает падающее поле любого допустимого первичного источ-

ника, расположенного вне области

. Следовательно, ее невозможно обнаружить

путем акустической локации с помощью падающего поля, создаваемого внешним

компактно распределенным источником.

3.

Постановка задачи сопряжения.

Предварительные результаты

Рассмотрим в

R

3

область

, удовлетворяющую следующему условию: (i)

ограниченная область в

R

3

типа шарового слоя с внутренностью

i

, внешностью

e

и криволинейной в общем случае липшицевой границей

Γ = Γ

1

Γ

2

, состоящей

из двух компонент: внутренней

Γ

1

и внешней

Γ

2

. Будем предполагать, что области

и

e

заполнены жидкими средами и пусть

ρ

и

η

– заданные функции в

, имеющие

смысл плотности среды и индекс рефракции в области

,

ρ

e

= const

и

c

e

= const

– постоянные плотность среды и скорость звука в

i

e

,

p

,

p

i

и

p

e

– звуковое

давление в

i

,

и

e

соответственно. Введем постоянное волновое число

k

=

ω/c

e

,

где

ω

– угловая частота. Граница

Γ

i

считается абсолютно жесткой. Предположим,

что во внешности

e

области

возникло поле

p

inc

. Поскольку область

является

препятствием для поля

p

inc

, то падение этого поля на

приводит к появлению

в области

входящего поля

p

, а в области

e

– появления рассеянного поля

p

s

.

Задача определения полей

p

в

и

p

s

в

e

играет важную роль в теоретической

акустике. Математически она сводится к задаче нахождения полей

p

i

в

i

,

p

в

и

p

e

=

p

inc

+

p

s

в

e

из следующих соотношений:

p

i

+

k

2

p

i

= 0

в

i

,

div(

ρ

1

p

) +

k

2

ηp

=

f

в

,

p

e

+

k

2

p

e

= 0

в

e

,

(9)

p

=

p

e

,

(

ρ

1

p

)

·

n

=

∂p

i

∂n

на

Γ

e

;

p

=

p

i

,

(

ρ

1

p

)

·

n

=

∂p

i

∂n

на

Γ

i

,

(10)

Сборник материалов XXXVII Дальневосточной Математической Школы-Семинара

имени академика Е.В. Золотова, Владивосток, 8 – 14 сентября 2013 г.


background image

136

∂p

s

(

x

)

∂r

ikp

s

(

x

) =

o

(

r

1

)

при

r

=

|

x

| → ∞

.

(11)

Здесь, в частности,

f

– плотность объемных источников в

(11) имеет смысл

условия излучения Зоммерфельда в

R

3

. Введем шар

B

R

радиуса

R

с границей

Γ

R

, содержащий

. Положим

e

= Ω

c

B

R

. Для произвольной пары функций

p

H

1

(Ω)

, p

e

H

1

(Ω

e

)

положим

P

= (

p, p

e

)

. Введем в рассмотрение гильбер-

тово пространство

V

=

H

1

(Ω)

×

H

1

(Ω

e

)

, состоящее из пар

P

= (

p, p

e

)

с нормой

|

[

P

]

|

2

=

k

p

k

2
1

,

+

k

p

e

k

2
1

,

e

. Мы закончим этот раздел сведением исходной задачи со-

пряжения (1)–(11к эквивалентной краевой задаче, рассматриваемой в ограничен-

ной области

B

R

. С этой целью введем отображение Дирихле–Неймана

T

:

H

1

/

2

R

)

H

1

/

2

R

)

, ставящее в соответствие каждой функции

g

H

1

/

2

R

)

функцию

˜

u/∂ν

H

1

/

2

R

)

, где

˜

u

– решение внешней задачи Дирихле для уравнения Гельм-

гольца

u

+

k

2

u

= 0

в

e

\

B

R

с условием

u

|

Γ

R

=

g

. Отметим, что задача (1)–(11) эк-

вивалентна краевой задаче (1), (3), рассматриваемой в ограниченной области

e

при следующем граничном условии для

p

s

:

∂p

s

∂n

=

T p

s

на

Γ

R

.

(12)

Для краткости на последнюю задачу будем ссылаться как на задачу 1.

4.

Сведение задачи 1 к слабой формулировке.

Разрешимость задачи сопряжения

Теперь мы можем свести задачу 1 к слабой формулировке. Введем гильберто-

во пространство

V

=

H

1

(

B

R

)

комплексных функций с нормой

k

S

k

V

=

k

S

k

H

1

(

B

R

)

.

Пусть

S

V

— произвольная функция. Отметим, что

S

имеет следы

S

|

Γ

e

H

1

/

2

e

)

,

S

|

Γ

i

H

1

/

2

i

)

и

S

|

Γ

R

H

1

/

2

R

)

. Умножим уравнение

L

0

p

i

= 0

на

S

|

i

, уравне-

ние

Lp

= 0

на

S

|

, уравнение

L

0

p

= 0

на

S

|

e

. Далее проинтегрируем по

i

,

,

e

соответственно и, используя формулы Грина и соотношения

p

e

=

p

inc

+

p

s

в

e

и

∂p

s

/∂n

=

T p

на

Γ

R

, сложим полученные тождества и учитывая граничные условия

(3), получим:

a

η

(

P, S

) =

F

(

S

)

≡ h

f

inc

, S

i

+

Z

ρ

1

f Sdx

S

X.

(13)

Здесь

a

:

X

×

X

C

и

F

:

X

C

– полуторалинейная и антилинейная формы,

определяемые формулами

a

(

P, S

) =

Z

i

(

p

i

· ∇

S

k

2

0

p

i

S

)

d

x

+

Z

(

ρ

1

p

)

· ∇

S

k

2

0

ηpS

d

x

+

+

Z

e

(

p

e

· ∇

S

k

2

0

p

e

S

)

d

x

Z

Γ

R

T

(

P

)

Sdσ,

(14)

F

(

S

) =

h

f

inc

, S

i

+

Z

ρ

1

f Sdx,

h

f

inc

, S

i

=

Z

Γ

R

T p

inc

Sdσ

+

Z

Γ

R

∂p

inc

∂n

Sdσ.

(15)

Решение

P

X

задачи (5) будем называть слабым решением задачи 1. Задача (5)

представляет собой слабую формулировку исходной задачи сопряжения. Важной

Сборник материалов XXXVII Дальневосточной Математической Школы-Семинара

имени академика Е.В. Золотова, Владивосток, 8 – 14 сентября 2013 г.


background image

137

проблемой является разработка эффективного численного алгоритма решения за-

дачи 1. В настоящей работе мы применим для этого метод конечных элементов.

МКЭ удобен тем, что в мире имеется большое количество пакетов программ, ос-

нованных на использовании МКЭ. Один из таких пакетов – FreeFem++(см. [6]) и

предполагается использовать в настоящей работе. Разработанный на основе МКЭ

численный алгоритм мы будем применять для нахождения поля, рассеянного на

препятствии

в том случае, когда параметры оболочки отвечают нерассеивающей

оболочке, построенной в разд. 2. При этом в качестве падающей волны мы будем

брать поле точечного источника, расположенного вне области

.

Удобно взять точечный источник, расположенный в точке

x

0

= (0

,

0

, z

0

)

,

z

0

> b

, где

b

– радиус внешней оболочки Поле данного источника описывается формулой

P

(

x

,

x

0

) =

1

4

π

e

ik

|

x

x

0

|

|

x

x

0

|

.

Ясно, что это поле не зависит от угла

ϕ

, поэтому решение исходной задачи со-

пряжения также не зависит от

ϕ

. Таким образом, она становится двумерной и ее

следует рассматривать в плоскости

r, θ

. Это упрощает как сам процесс численного

решения с помощью пакета FreeFem++, так и выдачу результатов. Теперь следует:

1. Ввести полученные выражения, отвечающие нерассеивающей оболочке, в пакет

FreeFem++. 2. Задать основные параметры сетки на

Σ

i

и

Σ

R

, выбирая число узлов

равным 40, 80 или 160. 3. Провести расчеты для указанных значений

N

и выдать

значения решения в сравнении со значениями, полученными теоретически.

5.

Заключение

В данной работе была выведена слабая формулировка исходной задачи сопря-

жения и доказана разрешимость задачи 1. Предложен и исследован алгоритм ре-

шения прямой задачи в пакете FreeFem++. Дальнейшему изучению особенностей

FreeFem++ и анализу численных расчетов будет посвящена отдельная работа авто-

ра.

Список литературы

1.

S.A. Cummer, D. Schurig One path to acoustic cloaking // New J. Phys. 2007. V.
9. 45.

2.

Cummer S.A., Popa B.I., Schurig D. et al. Scattering theory derivation of a 3D
acoustic cloaking shell// Phys. Rev. Letters. 2008. V. 100. P. 024301.

3.

Алексеев Г.В., Романов В.Г. Об одном классе нерассеивающих акустических
оболочек для модели анизотропной акустики// Сиб. журн. индустр. матем.
2012. Т. 6, № 2, C. 1–6.

4.

Дубинов А.Е., Мытарева Л.А. Маскировка материальных тел методом волно-
вого обтекания // Успехи физ. наук. 2010. Т. 180, № 5. С. 475–501.

5.

Alekseev G.V. Cloaking via impedance boundary condition for the 2-D Helmholtz
equation // Applicable Analysis. 2013. V. 93,№ 5. P. 1–15.

6.

http://www.freefem.org/ff++/index.htm

7.

6. Г.В. Алексеев, Р.В. Бризицкий, В. Г. Романов Оценки устойчивости реше-
ний задач граничного управления для уравнения Максвелла при смешанных
граничных условиях // Доклады Академии наук, 2012, Т. 447, № 1. С. 7–12

Сборник материалов XXXVII Дальневосточной Математической Школы-Семинара

имени академика Е.В. Золотова, Владивосток, 8 – 14 сентября 2013 г.


background image

УДК 004.252, 004.074.3

ИССЛЕДОВАНИЕ ПРОИЗВОДИТЕЛЬНОСТИ

РАБОТЫ ПАМЯТИ В NUMA-УЗЛАХ

ВЫЧИСЛИТЕЛЬНОГО КЛАСТЕРА

Д.В. Леонтьев

Дальневосточный Федеральный Университет

Россия, 690950, Владивосток, Суханова, 8

E-mail:

devozh@dvo.ru

Г.В. Тарасов

Институт автоматики и процессов управления ДВО РАН

Россия, 690041, Владивосток, Радио, 5

E-mail:

george@dvo.ru

Д.И. Харитонов

Институт автоматики и процессов управления ДВО РАН

Россия, 690041, Владивосток, Радио, 5

E-mail:

demiurg@dvo.ru

Ключевые слова:

архитектура вычислительных систем, неоднородный

доступ к памяти, производительность вычислительных систем

В работе рассматриваются вопросы производительности работы оператив-
ной памяти вычислительной системы с неоднородной архитектурой памяти.
Описывается алгоритм тестирования и структура разработанных тестов.
Проводится сравнительный анализ скорости работы памяти для вычисли-
тельного кластера на базе узлов с AMD и Intel процессорами, построенными
по архитектуре NUMA.

Введение

Последние годы рост производительности вычислительных систем достигается

наращиванием количества вычислительных ядер. Это могут быть как ядра процес-

соров общего назначения, так и специфические (легковесные) ядра графических

ускорителей и ядра сопроцессоров специального назначения. Разнообразие много-

ядерных архитектур накладывает отпечаток на структуру оперативной памяти вы-

числителя. В современных вычислительных узлах подсистема оперативной памяти

имеет сложную многоуровневую архитектуру, включающую непосредственно мик-

росхемы памяти (DRAM), контроллеры доступа к памяти из процессора, промежу-

точную кэш-память между ядрами процессора и контроллером, регистры вычис-

лительного ядра. Если элементы архитектуры выстроить в порядке возрастания

Сборник материалов XXXVII Дальневосточной Математической Школы-Семинара

имени академика Е.В. Золотова, Владивосток, 8 – 14 сентября 2013 г.


background image

139

времени доступа к соответствующему уровню со стороны вычислительного ядра,

то разница между максимальным и минимальным временем доступа может состав-

лять десятки и сотни тактов. Так, доступ к регистрам обычно происходит за 1 такт

работы процессора, доступ к микросхемам памяти по разным оценкам составляет

50-100 тактов [1, 2]. С увеличением количества вычислительных ядер (процессоров)

в рамках вычислительного узла разработчики аппаратного обеспечения вынужде-

ны находить оригинальные решения, позволяющие уменьшить влияние разницы

в скорости доступа и обеспечить необходимый показатель производительности вы-

полнения команд. Однако, в реальных вычислительных задачах ситуация может

обстоять несколько иначе. Игнорирование частных архитектурных особенностей,

заложенных разработчиками в заданную вычислительную систему, может приве-

сти к значительному падению производительности и эффективности прикладной

программы. Поэтому задача исследования этих частных характеристик вычисли-

тельных систем является актуальной и практически значимой. В данной работе

основное внимание уделяется исследованию производительности подсистемы памя-

ти на NUMA-узлах вычислительного кластера. В первой части работы описывается

методика измерений тех или иных характеристик памяти. Во второй части описыва-

ются результаты измерений этих характеристик на узлах вычислительного кластера

ЦКП “Дальневосточный Вычислительный Ресурс” ДВО РАН.

1.

Алгоритм измерений

Алгоритм измерение скорости работы той или иной подсистемы компьютера

достаточно простой. Нужно составить такую функцию в программе, которая бы за-

действовала заданные возможности вычислительной системы. Перед вызовом этой

функции и по окончанию ее работы замерить время (например, астрономическое

или относительное время). По разнице этих значений с заданной точностью опреде-

лить соответствующую частную характеристику. Несмотря на явную простоту всего

процесса, есть несколько требований, которые увеличивают сложность работы. Пер-

вое требование — для формирования измерительной нагрузки необходимо исполь-

зовать такие инструменты, которые доступны рядовому пользователю, и которые

могут использоваться в прикладных программах. Другими словами, нет необходи-

мости использовать специфический платформозависимый код. Понятно, что опти-

мизацию этого кода можно довести до совершенства и получить пиковые характери-

стики, которые уже известны по спецификации имеющегося оборудования. Авторов

прежде всего интересует производительность памяти при использовании стандарт-

ных библиотек, доступных рядовому пользователю. Для работы с памятью в работе

использовалось две библиотеки:

Стандартная библиотека GNU libc

библиотека libnuma

Второе требование состоит в том, чтобы исследовать производительность работы

памяти в многопоточном режиме при пиковых нагрузках на процессор. Таким обра-

зом, можно эмулировать работу вычислительного приложения работающего с боль-

шими объемами памяти. Третьим требованием является работа в реальных услови-

ях. То есть не создается никаких специальных условий для измерительной функции.

Сборник материалов XXXVII Дальневосточной Математической Школы-Семинара

имени академика Е.В. Золотова, Владивосток, 8 – 14 сентября 2013 г.